Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Замечание
Этот документ относится к порталу Microsoft Foundry (классическая модель).
Агенты (классические) теперь устарели и будут выведены из эксплуатации 31 марта 2027 года. Используйте новые агенты в общедоступной службе Агентов Microsoft Foundry. Следуйте руководству по миграции, чтобы обновить ваши рабочие нагрузки.
Azure OpenAI моделируют агенты питания в службе Microsoft Foundry Agent. В этой статье описано, как выбрать поддерживаемую модель и сочетание регионов для развертывания. Выбор правильной модели и региона влияет на возможности агента, задержку и затраты.
Чтобы использовать эти модели, вам потребуется проект Microsoft Foundry с доступом к Службе агента Foundry.
Microsoft Foundry предлагает два основных типа развертываний:
- Standard включает глобальный вариант развертывания, который направляет трафик через глобальную инфраструктуру Azure для повышения пропускной способности и доступности.
- Подготовленный также включает глобальный вариант развертывания. Вы можете приобрести и развернуть выделенные единицы пропускной способности (PTU) в глобальной инфраструктуре Azure, обеспечивая прогнозируемую производительность.
Все развертывания могут выполнять одни и те же операции вывода. Однако выставление счетов, масштабирование и производительность существенно отличаются. Дополнительные сведения о типах развертывания Azure OpenAI см. в разделе Типы развертывания для моделей Microsoft Foundry.
Как использовать эту страницу
Используйте таблицы в этой статье, чтобы выбрать поддерживаемую комбинацию типа развертывания, версии модели и региона Azure.
- Тип развертывания: используйте вкладки, чтобы выбрать тип развертывания, который планируется использовать (стандартный или подготовленный).
- Region: столбец Region содержит список Azure региона, в котором развертывается модель.
-
Маркеры доступности:
- ✅:Поддерживается.
- Пустые ячейки или
-: не поддерживается.
Выбор модели
Выберите модель на основе требований агента:
- Семейство gpt-5 (gpt-5, gpt-5-mini, gpt-5-nano, gpt-5-chat): передовое логическое обоснование для сложных, многоэтапных задач. Регистрация требуется для доступа.
- Семейство gpt-4.1 (gpt-4.1, gpt-4.1-mini, gpt-4.1-nano): экономичные модели для рабочих нагрузок агента общего назначения.
- семейство gpt-4o (gpt-4o, gpt-4o-mini): мультимодальные возможности с поддержкой зрения.
- gpt-4 и gpt-35-turbo: устаревшие модели для обратной совместимости.
Подсказка
Краткое руководство: Для большинства новых агентов разверните gpt-4o, 2024-11-20 в swedencentral или eastus2 с использованием стандартного глобального развертывания. Эти регионы имеют широкую доступность модели и низкую задержку для большинства сценариев.
Доступные модели
Служба агента Foundry поддерживает следующие Azure модели OpenAI в перечисленных регионах.
Помните, что доступность модели зависит от региона и облака. Для некоторых инструментов и возможностей требуются последние модели. Следующие модели доступны в REST API и пакетах SDK.
Замечание
- Эта статья относится к агентам (классическим), которые теперь устарели. Сведения об использовании моделей новее, чем gpt-5 см. в документации по агентам (новая).
- Центральные проекты ограничены следующими моделями: gpt-4o, gpt-4o-mini, gpt-4 и gpt-35-turbo.
- Сведения о поддержке подсети класса A можно найти в руководстве по настройке на GitHub.
- Средство поиска файлов в настоящее время недоступно в регионах "Северная Италия" и "Южная Бразилия".
- Модели gpt-5 могут использовать только интерпретатор кода и средства поиска файлов .
- Регистрация требуется для использования моделей gpt-5. Доступ предоставляется в соответствии с критериями соответствия корпорации Майкрософт.
| Регион | gpt-5 | gpt-5-mini | gpt-5-nano | gpt-5-chat | gpt-4.1 | gpt-4.1-nano | gpt-4.1-mini | gpt-4o (05-13) | gpt-4o (08-06) | gpt-4o (11-20) | гпт-4о-мини | gpt-4 | gpt-4-turbo |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| австралиявосток | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ||
| Бразильский Юг | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | |||||
| Канада Восток | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ||||
| Истус | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | |||
| eastus2 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| francecentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ||||
| Германия-запад-центр | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ||||
| северная италия | ✅ | ✅ | ✅ | ✅ | ✅ | ||||||||
| japaneast | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ||
| Норвегия Восток | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ||||
| Южная Африка-север | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | |||||
| СаутЦентралус | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ||||
| Южная Индия | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ||
| SwedenCentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Швейцария север | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ||
| UKSOUTH | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ||
| Западная Европа | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | |||||
| Вестус | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ||||
| westus3 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
Модели, отличные от OpenAI
Помимо моделей Azure OpenAI, можно использовать модели, предлагаемые напрямую Azure. Эти модели предоставляют специализированные возможности для конкретных вариантов использования, таких как детерминированное обоснование или создание высокой пропускной способности.
Модели продаются непосредственно компанией Azure:
- MAI-DS-R1: детерминированное умозаключение, ориентированное на точность.
- grok-4: Масштабное рассуждение для сложного многошагового решения проблем.
- grok-4-fast-reasoning: ускоренное агентивное мышление, оптимизированное для автоматизации рабочих процессов.
- grok-4-fast-non-reasoning: высокая пропускная способность, низкой задержки и системная маршрутизация.
- grok-3: строгое обоснование сложных рабочих процессов на уровне системы.
- grok-3-mini: упрощенная модель, оптимизированная для интерактивных вариантов использования с большим объемом.
- Ллома-3.3-70B-Instruct: универсальная модель для корпоративных вопросов и ответов, поддержки принятия решений и системной оркестрации.
- Llama-4-Maverick-17B-128E-Instruct-FP8: модель, оптимизированная для FP8, которая обеспечивает быстрый и эффективный по затратам инференс.
- DeepSeek-V3-0324: многомодальное понимание текста и изображений.
- DeepSeek-V3.1: улучшенное многомодальное анализирование и контекстуальное извлечение.
- DeepSeek-R1-0528: расширенные долгосрочные и многошаговые рассуждения.
- gpt-oss-120b: модель open-ecosystem, которая поддерживает прозрачность и воспроизводимость.
Просмотр всех поддерживаемых агентом моделей на портале Foundry
Чтобы просмотреть полный список поддерживаемых моделей на портале Foundry:
- Войдите в Microsoft Foundry. Убедитесь, что переключатель New Foundry отключен. Эти действия относятся к Foundry (classic).
- Перейдите в каталог моделей.
- Отфильтруйте модели по возможностям и выберите поддерживаемый агент.
Проверка поддержки модели
Доступность модели может меняться с течением времени.
- Чтобы проверить, что можно развернуть для проекта и региона, используйте модель портала Foundry, описанную в предыдущем разделе.
- Если вы используете выделенную пропускную способность, убедитесь, что единицы пропускной способности (ЕПС) доступны в целевом регионе. Дополнительные сведения см. в разделе "Подготовленная пропускная способность".
Устранение неполадок
Модель или версия недоступна в вашем регионе
- Убедитесь, что выбрана правильная вкладка для типа развертывания.
- Попробуйте другой регион, поддерживающий модель и версию.
- Если вы используете модели gpt-5, убедитесь, что у вашей подписки есть доступ. Для некоторых моделей требуется регистрация.
Поиск файлов недоступен
- Поиск по файлам недоступен в Северной Италии и Южной Бразилии. Выберите поддерживаемый регион или используйте другое средство.
Неудачная попытка развертывания выделенной пропускной способности
- Убедитесь, что в вашем распоряжении достаточное количество PTU в регионе.
- Просмотрите выделенную пропускную способность и управление избыточным трафиком.