Примечание
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Каталог моделей на портале Azure AI Foundry — это центр для обнаружения и использования широкого спектра моделей для создания создаваемых приложений ИИ. Модели необходимо развернуть, чтобы сделать их доступными для получения запросов на вывод. Azure AI Foundry предлагает полный набор вариантов развертывания моделей в зависимости от ваших потребностей и требований к модели.
Развертывание моделей
Параметры развертывания зависят от предложения модели:
- Модели Azure OpenAI: Последние модели OpenAI с корпоративными функциями из Azure с гибкими параметрами выставления счетов.
- Модели как услуга: Эти модели не требуют вычислительных квот из подписки и оплачиваются за токен с оплатой по мере использования.
- Открытые и настраиваемые модели: Каталог моделей предоставляет доступ к различным моделям в различных модальности, включая модели открытого доступа. Вы можете размещать открытые модели в собственной подписке с помощью управляемой инфраструктуры, виртуальных машин и количества экземпляров для управления емкостью.
Azure AI Foundry предлагает четыре различных варианта развертывания:
Имя | Служба Azure OpenAI | Вывод модели искусственного интеллекта Azure | Бессерверный API | Управляемые вычисления |
---|---|---|---|---|
Какие модели можно развернуть? | Модели Azure OpenAI | Модели Azure OpenAI и модели как услуга | Модели как услуга | Открытые и настраиваемые модели |
Ресурс развертывания | Ресурс Azure OpenAI | Ресурс служб ИИ Azure | Ресурс проекта ИИ | Ресурс проекта ИИ |
Требуются центры и проекты | нет | нет | Да | Да |
Параметры обработки данных | Региональный Зона данных Глобальный |
Глобальный | Региональный | Региональный |
Частная сеть | Да | Да | Да | Да |
Фильтрация содержимого | Да | Да | Да | нет |
Фильтрация пользовательского содержимого | Да | Да | нет | нет |
Проверка подлинности без ключа | Да | Да | нет | нет |
Лучше всего подходит, когда | Вы планируете использовать только модели OpenAI | Вы планируете воспользоваться флагманскими моделями в каталоге ИИ Azure, включая OpenAI. | Вы планируете использовать одну модель из определенного поставщика (за исключением OpenAI). | Если вы планируете использовать открытые модели и у вас достаточно квоты вычислений, доступной в подписке. |
Базы выставления счетов | Использование токенов и единицы выделенной пропускной способности | Использование токенов | Использованиемаркера 1 | Вычислите часы ядер2 |
Инструкции по развертыванию | Развертывание в Службе OpenAI Azure | Развертывание для вывода модели искусственного интеллекта в Azure | Развертывание в бессерверном API | Развертывание на управляемую вычислительную среду |
1 Минимальная инфраструктура конечных точек оплачивается за каждую минуту. Вы не оплачиваете инфраструктуру, где размещена модель, в режиме оплаты по мере использования. После удаления конечной точки дополнительные расходы не будут взиматься.
2 Выставление счетов выполняется по минуте в зависимости от уровня продукта и количества экземпляров, используемых в развертывании с момента создания. После удаления конечной точки дополнительные расходы не будут взиматься.
Подсказка
Дополнительные сведения о том, как отслеживать затраты, см. в статье "Мониторинг затрат для моделей, предлагаемых через Azure Marketplace".
Как подумать о вариантах развертывания?
Azure AI Foundry рекомендует вам изучить различные варианты развертывания и выбрать оптимальный набор бизнес-потребностей и технических потребностей. Как правило, рекомендуется использовать следующий подход для выбора варианта развертывания:
Начните с вывода модели ИИ Azure, которая является вариантом с самой большой областью. Этот параметр позволяет выполнять итерацию и прототип быстрее в приложении, не перестраивая архитектуру каждый раз, когда вы решите изменить что-то. Если вы используете центры или проекты Azure AI Foundry, включите этот параметр, включив функцию вывода модели ИИ Azure.
Если вы хотите использовать определенную модель:
Если вы заинтересованы в моделях Azure OpenAI, используйте службу Azure OpenAI. Этот параметр предназначен для моделей Azure OpenAI и предоставляет широкий спектр возможностей для них.
Если вы заинтересованы в определенной модели из model-as-Service, и вы не ожидаете использовать какой-либо другой тип модели, используйте конечные точки API без сервера. Бессерверные конечные точки позволяют развертывать одну модель в уникальном наборе URL-адреса и ключей конечной точки.
Если модель недоступна в model-as-Service и у вас есть квота вычислений, доступная в подписке, используйте управляемые вычисления, поддерживающие развертывание открытых и пользовательских моделей. Кроме того, он обеспечивает высокий уровень настройки сервера вывода развертывания, протоколов и подробной конфигурации.