Обзор. Развертывание моделей ИИ в Azure AI Studio
Каталог моделей в Студии искусственного интеллекта Azure — это центр для обнаружения и использования широкого спектра моделей для создания создаваемых приложений ИИ. Модели необходимо развернуть, чтобы сделать их доступными для получения запросов вывода. Процесс взаимодействия с развернутой моделью называется выводом. Azure AI Studio предлагает полный набор вариантов развертывания для этих моделей в зависимости от ваших потребностей и требований к модели.
Развертывание моделей
Параметры развертывания зависят от типа модели:
- Модели Azure OpenAI: последние модели OpenAI, имеющие корпоративные функции из Azure.
- Модели как услуга. Эти модели не требуют квоты вычислений из подписки. Этот параметр позволяет развернуть модель как службу (MaaS). Вы используете бессерверное развертывание API и выставляются счета за токен в режиме оплаты по мере использования.
- Открытые и пользовательские модели: каталог моделей предоставляет доступ к различным моделям в разных модальности, которые имеют открытый доступ. Вы можете размещать открытые модели в собственной подписке с помощью управляемой инфраструктуры, виртуальных машин и количества экземпляров для управления емкостью. Существует широкий спектр моделей из Azure OpenAI, Hugging Face и NVIDIA.
Azure AI Studio предлагает четыре различных варианта развертывания:
Имя. | Служба Azure OpenAI | Служба вывода модели искусственного интеллекта Azure | Бессерверный API | Управляемые вычисления |
---|---|---|---|---|
Какие модели можно развернуть? | Модели Azure OpenAI | Модели и модели Azure OpenAI как услуга | Модели как услуга | Открытые и настраиваемые модели |
Ресурс развертывания | Ресурс Azure OpenAI | Ресурс служб ИИ Azure | Ресурс проекта ИИ | Ресурс проекта ИИ |
Лучше всего подходит, когда | Вы планируете использовать только модели OpenAI | Вы планируете воспользоваться преимуществами флагманских моделей в каталоге ИИ Azure, включая OpenAI. | Вы планируете использовать одну модель из определенного поставщика (за исключением OpenAI). | Если вы планируете использовать открытые модели и у вас достаточно квоты вычислений, доступной в подписке. |
Базы выставления счетов | Использование маркеров и PTU | Использование маркеров | Использованиемаркера 1 | 2 часа вычислительных ядер |
Инструкции по развертыванию | Развертывание в Службе OpenAI Azure | Развертывание в модели искусственного интеллекта Azure | Развертывание в бессерверном API | Развертывание в управляемых вычислениях |
1 Минимальная инфраструктура конечных точек взимается в минуту. Вы не оплачиваете инфраструктуру, на которую размещена модель в режиме оплаты по мере использования. После удаления конечной точки дополнительные расходы не будут взиматься.
2 Выставление счетов выполняется по минуте в зависимости от уровня продукта и количества экземпляров, используемых в развертывании с момента создания. После удаления конечной точки дополнительные расходы не будут взиматься.
Совет
Дополнительные сведения о том, как отслеживать затраты, см. в статье "Мониторинг затрат для моделей, предлагаемых через Azure Marketplace".
Как подумать о вариантах развертывания?
Студия искусственного интеллекта Azure призывает клиентов изучить варианты развертывания и выбрать наиболее подходящий набор бизнес-потребностей и технических потребностей. Как правило, можно использовать следующий процесс мышления:
Начните с вариантов развертывания, имеющих более крупные области. Это позволяет быстрее выполнять итерацию и прототип в приложении, не перестраивая архитектуру каждый раз, когда вы решите изменить что-то. Служба вывода модели искусственного интеллекта Azure — это цель развертывания, которая поддерживает все флагманские модели в каталоге ИИ Azure, включая последние инновации из Azure OpenAI.
При поиске использования конкретной модели:
Если вы заинтересованы в моделях Azure OpenAI, используйте службу Azure OpenAI, которая предлагает широкий спектр возможностей для них и предназначен для них.
Если вы заинтересованы в конкретной модели из моделей как услуга, и вы не ожидаете использовать любой другой тип модели, используйте бессерверные конечные точки API. Они позволяют развертывать одну модель в уникальном наборе URL-адреса и ключей конечной точки.
Если модель недоступна в модели как услуга и у вас есть квота вычислений, доступная в подписке, используйте управляемые вычисления , которые поддерживают развертывание открытых и настраиваемых моделей. Он также позволяет настроить сервер вывода развертывания, протоколы и подробную конфигурацию.
Совет
Каждый вариант развертывания может предложить различные возможности с точки зрения сети, безопасности и дополнительных функций, таких как безопасность содержимого. Ознакомьтесь с документацией по каждому из них, чтобы понять их ограничения.