Поделиться через


Обзор. Развертывание моделей ИИ на портале Azure AI Foundry

Каталог моделей на портале Azure AI Foundry — это центр для обнаружения и использования широкого спектра моделей для создания создаваемых приложений ИИ. Модели необходимо развернуть, чтобы сделать их доступными для получения запросов на вывод. Azure AI Foundry предлагает полный набор вариантов развертывания моделей в зависимости от ваших потребностей и требований к модели.

Развертывание моделей

Параметры развертывания зависят от предложения модели:

  • Модели Azure OpenAI: Последние модели OpenAI с корпоративными функциями из Azure с гибкими параметрами выставления счетов.
  • Модели как услуга: Эти модели не требуют вычислительных квот из подписки и оплачиваются за токен с оплатой по мере использования.
  • Открытые и настраиваемые модели: Каталог моделей предоставляет доступ к различным моделям в различных модальности, включая модели открытого доступа. Вы можете размещать открытые модели в собственной подписке с помощью управляемой инфраструктуры, виртуальных машин и количества экземпляров для управления емкостью.

Azure AI Foundry предлагает четыре различных варианта развертывания:

Имя Служба Azure OpenAI Вывод модели искусственного интеллекта Azure Бессерверный API Управляемые вычисления
Какие модели можно развернуть? Модели Azure OpenAI Модели Azure OpenAI и модели как услуга Модели как услуга Открытые и настраиваемые модели
Ресурс развертывания Ресурс Azure OpenAI Ресурс служб ИИ Azure Ресурс проекта ИИ Ресурс проекта ИИ
Требуются центры и проекты нет нет Да Да
Параметры обработки данных Региональный
Зона данных
Глобальный
Глобальный Региональный Региональный
Частная сеть Да Да Да Да
Фильтрация содержимого Да Да Да нет
Фильтрация пользовательского содержимого Да Да нет нет
Проверка подлинности без ключа Да Да нет нет
Лучше всего подходит, когда Вы планируете использовать только модели OpenAI Вы планируете воспользоваться флагманскими моделями в каталоге ИИ Azure, включая OpenAI. Вы планируете использовать одну модель из определенного поставщика (за исключением OpenAI). Если вы планируете использовать открытые модели и у вас достаточно квоты вычислений, доступной в подписке.
Базы выставления счетов Использование токенов и единицы выделенной пропускной способности Использование токенов Использованиемаркера 1 Вычислите часы ядер2
Инструкции по развертыванию Развертывание в Службе OpenAI Azure Развертывание для вывода модели искусственного интеллекта в Azure Развертывание в бессерверном API Развертывание на управляемую вычислительную среду

1 Минимальная инфраструктура конечных точек оплачивается за каждую минуту. Вы не оплачиваете инфраструктуру, где размещена модель, в режиме оплаты по мере использования. После удаления конечной точки дополнительные расходы не будут взиматься.

2 Выставление счетов выполняется по минуте в зависимости от уровня продукта и количества экземпляров, используемых в развертывании с момента создания. После удаления конечной точки дополнительные расходы не будут взиматься.

Подсказка

Дополнительные сведения о том, как отслеживать затраты, см. в статье "Мониторинг затрат для моделей, предлагаемых через Azure Marketplace".

Как подумать о вариантах развертывания?

Azure AI Foundry рекомендует вам изучить различные варианты развертывания и выбрать оптимальный набор бизнес-потребностей и технических потребностей. Как правило, рекомендуется использовать следующий подход для выбора варианта развертывания:

  • Начните с вывода модели ИИ Azure, которая является вариантом с самой большой областью. Этот параметр позволяет выполнять итерацию и прототип быстрее в приложении, не перестраивая архитектуру каждый раз, когда вы решите изменить что-то. Если вы используете центры или проекты Azure AI Foundry, включите этот параметр, включив функцию вывода модели ИИ Azure.

  • Если вы хотите использовать определенную модель:

    • Если вы заинтересованы в моделях Azure OpenAI, используйте службу Azure OpenAI. Этот параметр предназначен для моделей Azure OpenAI и предоставляет широкий спектр возможностей для них.

    • Если вы заинтересованы в определенной модели из model-as-Service, и вы не ожидаете использовать какой-либо другой тип модели, используйте конечные точки API без сервера. Бессерверные конечные точки позволяют развертывать одну модель в уникальном наборе URL-адреса и ключей конечной точки.

  • Если модель недоступна в model-as-Service и у вас есть квота вычислений, доступная в подписке, используйте управляемые вычисления, поддерживающие развертывание открытых и пользовательских моделей. Кроме того, он обеспечивает высокий уровень настройки сервера вывода развертывания, протоколов и подробной конфигурации.