Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
В этой статье вы узнаете, как использовать портал Foundry для развертывания модели Foundry в ресурсе Foundry для вывода. Модели Foundry включают такие модели, как модели Azure OpenAI, модели Meta Llama и многое другое. После развертывания модели Foundry вы можете взаимодействовать с ней в песочнице Foundry и использовать ее в коде.
В этой статье используется модель Foundry от партнеров и сообщества Llama-3.2-90B-Vision-Instruct для иллюстрации. Модели от партнеров и сообщества требуют подписки на Azure Marketplace перед развертыванием. С другой стороны, модели Foundry, проданные непосредственно Azure, такие как Azure OpenAI в модели Foundry, не имеют этого требования. Дополнительные сведения о моделях Foundry, включая регионы, где они доступны для развертывания, см. в разделе Foundry Models, продаваемых напрямую через Azure и Foundry Models от партнеров и сообщества.
Необходимые условия
Чтобы завершить эту статью, вам потребуется:
Подписка Azure с допустимым методом оплаты. Если у вас нет подписки Azure, создайте платную учетную запись Azure, чтобы начать. Если вы используете модели GitHub, вы можете upgrade to Foundry Models и создать подписку Azure в процессе.
Роль участника Cognitive Services или эквивалентные разрешения на ресурсе Foundry для создания и управления развертываниями. Дополнительные сведения см. в разделе роли Azure RBAC.
Проект Microsoft Foundry. Этот тип проекта управляется ресурсом Foundry.
Foundry Models от партнеров и сообщества необходим доступ к Azure Marketplace для создания подписок. Убедитесь, что у вас есть разрешения, необходимые для подписки на предложения моделей. Foundry Models, которые продаются непосредственно Azure не имеют этого требования.
Развертывание модели
Разверните модель, выполнив следующие действия на портале Foundry:
-
Войдите в Microsoft Foundry. Убедитесь, что переключатель New Foundry включен. Эти действия относятся к Foundry (new).
На домашней странице портала Foundry выберите "Обнаружить " в правой верхней части навигации, а затем " Модели " на левой панели.
Выберите модель и просмотрите ее сведения в карточке модели. Эта статья использует
Llama-3.2-90B-Vision-Instructдля иллюстрации.Выберите Развернуть>Настраиваемые параметры, чтобы настроить развертывание. Кроме того, можно использовать параметры развертывания по умолчанию, выбрав пункт "Развернуть>параметры по умолчанию".
Для Foundry Models от партнеров и сообщества необходимо подписаться на Azure Marketplace. Это требование относится к
Llama-3.2-90B-Vision-Instruct, например. Ознакомьтесь с условиями использования и выберите "Согласиться" и "Продолжить ", чтобы принять условия.Примечание
Для моделей Foundry Models, проданных непосредственно компанией Azure, таких как модель Azure OpenAI
gpt-4o-mini, вы не подписываетесь на Azure Marketplace.Настройте параметры развертывания:
- По умолчанию развертывание использует имя модели. Это имя можно изменить перед развертыванием.
- Во время выполнения вывода имя развертывания используется в параметре
modelдля маршрутизации запросов к этому конкретному развертыванию.
Выберите Развертывание, чтобы создать развертывание.
Совет
Каждая модель поддерживает различные типы развертывания, предоставляя различные гарантии расположения данных или пропускной способности. Дополнительные сведения см. в типах развертывания . В этом примере модель поддерживает тип развертывания Global Standard.
Когда развертывание завершится, вы приземлились на игровых площадках Foundry , где можно интерактивно протестировать модель. Проект и ресурс должны находиться в одном из поддерживаемых регионов развертывания для модели. Убедитесь, что состояние развертывания отображается успешно в списке развертываний.
Управление моделями
Вы можете управлять существующими развертываниями моделей в ресурсе с помощью портала Foundry.
Выберите "Сборка " в правой верхней части навигации.
Выберите модели в левой области, чтобы просмотреть список развертываний в ресурсе.
На странице сведений о развертывании можно просмотреть сведения о конечной точке и ключи, настроить параметры развертывания или удалить развертывание, которое больше не требуется.
Тестирование развертывания на игровой площадке
Вы можете взаимодействовать с новой моделью на портале Foundry с помощью игровой площадки. Детская площадка — это веб-интерфейс, который позволяет взаимодействовать с моделью в режиме реального времени. Используйте игровую площадку для тестирования модели с различными запросами и просмотра ответов модели.
В списке развертываний выберите развертывание Llama-3.2-90B-Vision-Instruct , чтобы открыть страницу игровой площадки.
Введите запрос и просмотрите выходные данные.
Перейдите на вкладку "Код" , чтобы узнать, как получить доступ к развертыванию модели программным способом.
Используйте модель с кодом
См. следующие примеры запуска инференса на развернутой модели:
Чтобы использовать API Responses с моделями Foundry, продаваемыми напрямую Azure, такими как Microsoft AI, DeepSeek и Grok, см. статью О том, как создавать текстовые ответы с помощью моделей Microsoft Foundry.
Сведения об использовании API ответов с моделями OpenAI см. в статье "Начало работы с API ответов".
Чтобы использовать API завершения чата с моделями, проданными партнерами, такими как модель Llama, развернутая в этой статье, см. раздел "Поддержка модели для завершения чата".
Региональная доступность и ограничения квоты модели
Для моделей Foundry квота по умолчанию зависит от модели и региона. Некоторые модели могут быть доступны только в некоторых регионах. Дополнительные сведения о доступности и ограничениях на квоты см. в разделе модели Azure OpenAI в квотах и ограничениях Microsoft Foundry и квоты и ограничения моделей Microsoft Foundry.
Квота для развертывания и выполнения вывода в модели
Для моделей Foundry развертывание и выполнение инференса используют квоту, которую Azure назначает вашей подписке по регионам и моделям, измеряемую в единицах Токенов в минуту (TPM). При регистрации в Foundry вы получаете квоту по умолчанию для большинства доступных моделей. Затем вы назначаете TPM для каждого развертывания, уменьшая доступную квоту для этой модели. Вы можете продолжать создавать развертывания и назначать им TPM, пока не достигнете лимита квоты.
Если вы достигнете предела квоты, вы можете создавать только новые развертывания этой модели, если вы:
- Запросите больше квоты, отправив форму увеличения квоты.
- Настройте выделенную квоту на развертывания других моделей на портале Foundry, чтобы освободить токены для новых развертываний.
Дополнительные сведения о квоте см. в разделах Квоты и ограничения моделей Microsoft Foundry и Управление квотой Azure OpenAI.
Устранение неполадок
| Проблема | Разрешение |
|---|---|
| Превышена квота | Запросить больше квоты или перераспределить TPM из существующих развертываний. |
| Регион не поддерживается | Проверьте доступность регионов и разверните его в поддерживаемом регионе. |
| Ошибка подписки Marketplace | Убедитесь, что у вас есть необходимые разрешения для оформления подписки на предложения Azure Marketplace. |
| Статус развертывания показывает Неудачно | Убедитесь, что модель доступна в выбранном регионе и у вас есть достаточная квота. |