Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
В этой статье перечислена выборка моделей Microsoft Foundry, продаваемых непосредственно через Azure вместе с их возможностями, типов развертывания и регионов доступности, за исключением устаревших и не поддерживаемых моделей. Список моделей OpenAI Azure, поддерживаемых службой агента Foundry, см. в разделе Models, поддерживаемые службой агента. Модели, проданные непосредственно Azure включают все Azure модели OpenAI и определенные, выбранные модели из лучших поставщиков. Эти модели выставляются через подписку Azure, охватываются соглашениями Azure об уровне обслуживания и поддерживаются корпорацией Майкрософт. Сведения о моделях, предлагаемых партнерами за пределами этого списка, см. в разделе "Модели Foundry" от партнеров и сообщества.
Используйте вкладки в верхней части этой страницы, чтобы переключаться между моделями Azure OpenAI и другими коллекциями моделей от поставщиков, таких как Cohere, DeepSeek, Meta, Mistral AI и xAI.
Модели Foundry доступны для стандартного развертывания в ресурсе Foundry.
Дополнительные сведения об атрибутах моделей Foundry, проданных непосредственно Azure, см. в разделе Explore Foundry Models.
Замечание
Модели Foundry, проданные через Azure, также включают отдельные модели от лучших поставщиков моделей, таких как:
- Лаборатории Black Forest:
FLUX.2-flex,FLUX.2-pro,FLUX.1-Kontext-pro,FLUX-1.1-pro - Cohere:
Cohere-command-a,embed-v-4-0,Cohere-rerank-v4.0-proCohere-rerank-v4.0-fast - DeepSeek:
DeepSeek-V3.2,DeepSeek-V3.2-Speciale,DeepSeek-V3.1DeepSeek-V3-0324,DeepSeek-R1-0528DeepSeek-R1 - Moonshot AI:
Kimi-K2.5,Kimi-K2-Thinking - Мета:
Llama-4-Maverick-17B-128E-Instruct-FP8,Llama-3.3-70B-Instruct - Майкрософт:
MAI-DS-R1,model-router - Мистраль:
mistral-document-ai-2512,mistral-document-ai-2505Mistral-Large-3 - xAI:
grok-code-fast-1,grok-3grok-3-minigrok-4-fast-reasoninggrok-4-fast-non-reasoninggrok-4grok-4.1-fast-reasoninggrok-4.1-fast-non-reasoning
Чтобы узнать об этих моделях, перейдите в другие коллекции моделей в верхней части этой статьи.
Azure OpenAI в моделях Microsoft Foundry
Azure OpenAI работает с различным набором моделей с разными возможностями и ценовыми точками. Доступность модели зависит от региона и облака. Сведения о доступности модели Azure Government см. в Azure OpenAI в Azure Government.
| Модели | Description |
|---|---|
| Серия GPT-5.4 |
NEWgpt-5.4-mini, , gpt-5.4-nano, gpt-5.4gpt-5.4-pro |
| Серия GPT-5.3 |
Новые функцииgpt-5.3-codex |
| Серия GPT-5.2 |
NEWgpt-5.2-codex, , gpt-5.2gpt-5.2-chat(предварительная версия) |
| Серия GPT-5.1 |
NEWgpt-5.1, , gpt-5.1-chat, gpt-5.1-codexgpt-5.1-codex-mini |
| Сора | НОВАЯ сора-2 |
| Серия GPT-5 | gpt-5, gpt-5-mini, gpt-5-nano, gpt-5-chat |
| gpt-oss | Модели причин открытого веса |
| codex-mini | Точно настроенная версия o4-mini. |
| Серия GPT-4.1 | gpt-4.1, gpt-4.1-mini, gpt-4.1-nano |
| предварительный просмотр использования компьютера | Экспериментальная модель, обученная для использования с инструментом API Responses для работы с компьютером. |
| модели o-серии | Модели рассуждений с расширенным решением проблем и повышением фокуса и возможностей. |
| GPT-4o, GPT-4o mini и GPT-4 Turbo | Модели OpenAI в Azure с многомодальными версиями, способные принимать как текст, так и изображения в качестве входных данных. |
| Embeddings | Набор моделей, способных преобразовывать текст в числовую векторную форму для обеспечения сходства текстов. |
| Генерирование изображений | Серия моделей, которые могут создавать исходные изображения на естественном языке. |
Video generation |
Модель, которая может создавать исходные видео-сцены из текстовых инструкций. |
| Аудио | Серия моделей для преобразования речи в текст, перевод и текст в речь. Модели аудио GPT-4o поддерживают либо разговорные взаимодействия с речевым входом и выходом с низкой задержкой, либо генерацию аудио. |
GPT-5.4
| Модель | Регион |
|---|---|
gpt-5.4 |
Смотрите таблицу моделей |
gpt-5.4-pro |
Смотрите таблицу моделей |
gpt-5.4-mini |
Глобальный стандарт: Восток США2 Центральная Швеция Южно-Центральный регион США Центральная Польша |
gpt-5.4.nano |
Глобальный стандарт: Восток США2 Центральная Швеция Южно-Центральный регион США Центральная Польша Datazone Standard: Восток США2 Южно-Центральный регион США |
| Идентификатор модели | Description | Окно контекста | Максимальное количество выходных токенов | Учебные данные (вплоть до) |
|---|---|---|---|---|
gpt-5.4 (2026-03-05) |
-
Рассуждение - API ответов. — API завершения чата. — структурированные выходные данные. — Обработка текста и изображения. — Функции, инструменты и параллельные вызовы инструментов. - Использование компьютера - Полная сводка возможностей. |
1,050,000 | 128,000 | Август 2025 г. |
gpt-5.4-pro (2026-03-05) |
-
Рассуждение - API ответов. — Обработка текста и изображения. — Функции и инструменты - Полная сводка возможностей. |
1,050,000 | 128,000 | Август 2025 г. |
gpt-5.4-mini (2026-03-17) |
-
Рассуждение - API ответов. — API завершения чата. — структурированные выходные данные. — Обработка текста и изображения. — Функции, инструменты и параллельные вызовы инструментов. - Использование компьютера - Полная сводка возможностей. |
400 000 Входные данные: 272 000 Результат: 128 000 |
128,000 | Август 2025 г. |
gpt-5.4-nano (2026-03-17) |
-
Рассуждение - API ответов. — API завершения чата. — структурированные выходные данные. — Обработка текста и изображения. — Функции, инструменты и параллельные вызовы инструментов. - Полная сводка возможностей. |
400 000 Входные данные: 272 000 Результат: 128 000 |
128,000 | Август 2025 г. |
GPT-5.3
| Модель | Регион |
|---|---|
gpt-5.3-codex |
Смотрите таблицу моделей |
| Идентификатор модели | Description | Окно контекста | Максимальное количество выходных токенов | Учебные данные (вплоть до) |
|---|---|---|---|---|
gpt-5.3-codex (2026-02-24) |
-
Рассуждение - API ответов. — структурированные выходные данные. — Обработка текста и изображения. — Функции, инструменты и параллельные вызовы инструментов. - Полная сводка возможностей. — Оптимизировано для расширения Codex CLI и Codex VS Code |
400 000 Входные данные: 272 000 Результат: 128 000 |
128,000 | Август 2025 г. |
GPT-5.2
Доступность по регионам
| Модель | Регион |
|---|---|
gpt-5.2 |
См. таблицу моделей. |
gpt-5.2-chat |
См. таблицу моделей. |
gpt-5.2-codex |
Смотрите таблицу моделей |
Доступ будет предоставлен на основе критериев соответствия требованиям Майкрософт. Клиенты, которые ранее подавали заявку и получили доступ к модели с ограниченным доступом, не нужно подавать заявку снова, так как утвержденные подписки автоматически будут предоставлены доступ при выпуске модели.
| Идентификатор модели | Description | Окно контекста | Максимальное количество выходных токенов | Учебные данные (вплоть до) |
|---|---|---|---|---|
gpt-5.2-codex (2026-01-14) |
-
Рассуждение - API ответов. — структурированные выходные данные. — Обработка текста и изображения. — Функции, инструменты и параллельные вызовы инструментов. - Полная сводка возможностей. — Оптимизировано для расширения Codex CLI и Codex VS Code |
400 000 Входные данные: 272 000 Результат: 128 000 |
128,000 | |
gpt-5.2 (2025-12-11) |
-
Рассуждение — API завершения чата. - API ответов. — структурированные выходные данные. — Обработка текста и изображения. — Функции, инструменты и параллельные вызовы инструментов. - Полная сводка возможностей. |
400 000 Входные данные: 272 000 Результат: 128 000 |
128,000 | Август 2025 г. |
gpt-5.2-chat (2025-12-11)Preview |
— API завершения чата. - API ответов. — структурированные выходные данные — Функции, инструменты и параллельные вызовы инструментов. |
128,000 Входные данные: 111 616 Выходные данные: 16 384 |
16,384 | Август 2025 г. |
gpt-5.2-chat (2026-02-10)Preview |
— API завершения чата. - API ответов. — структурированные выходные данные — Функции, инструменты и параллельные вызовы инструментов. |
128,000 Входные данные: 111 616 Выходные данные: 16 384 |
16,384 | Август 2025 г. |
Предостережение
Мы не рекомендуем использовать предварительные версии моделей в рабочей среде. Мы обновим все развертывания предварительных моделей либо до будущих версий, либо до последней стабильной общедоступной версии. Модели, назначенные предварительной версией, не соответствуют стандартному жизненному циклу модели OpenAI Azure.
ГПТ-5.1
Доступность по регионам
| Модель | Регион |
|---|---|
gpt-5.1 |
См. таблицу моделей. |
gpt-5.1-chat |
См. таблицу моделей. |
gpt-5.1-codex |
См. таблицу моделей. |
gpt-5.1-codex-mini |
См. таблицу моделей. |
gpt-5.1-codex-max |
См. таблицу моделей. |
| Идентификатор модели | Description | Окно контекста | Максимальное количество выходных токенов | Учебные данные (вплоть до) |
|---|---|---|---|---|
gpt-5.1 (2025-11-13) |
-
Рассуждение — API завершения чата. - API ответов. — структурированные выходные данные. — Обработка текста и изображения. — Функции, инструменты и параллельные вызовы инструментов. - Полная сводка возможностей. |
400 000 Входные данные: 272 000 Результат: 128 000 |
128,000 | 30 сентября 2024 г. |
gpt-5.1-chat (2025-11-13) Preview |
-
Рассуждение — API завершения чата. - API ответов. — структурированные выходные данные — Функции, инструменты и параллельные вызовы инструментов. |
128,000 Входные данные: 111 616 Выходные данные: 16 384 |
16,384 | 30 сентября 2024 г. |
gpt-5.1-codex (2025-11-13) |
-
Только API ответов . — Обработка текста и изображений — структурированные выходные данные. — Функции, инструменты и параллельные вызовы инструментов. - Полная сводка возможностей — Оптимизировано для расширения Codex CLI и Codex VS Code |
400 000 Входные данные: 272 000 Результат: 128 000 |
128,000 | 30 сентября 2024 г. |
gpt-5.1-codex-mini (2025-11-13) |
-
Только API ответов . — Обработка текста и изображений — структурированные выходные данные. — Функции, инструменты и параллельные вызовы инструментов. - Полная сводка возможностей — Оптимизировано для расширения Codex CLI и Codex VS Code |
400 000 Входные данные: 272 000 Результат: 128 000 |
128,000 | 30 сентября 2024 г. |
gpt-5.1-codex-max (2025-12-04) |
-
Только API ответов . — Обработка текста и изображений — структурированные выходные данные. — Функции, инструменты и параллельные вызовы инструментов. - Полная сводка возможностей — Оптимизировано для расширения Codex CLI и Codex VS Code |
400 000 Входные данные: 272 000 Результат: 128 000 |
128,000 | 30 сентября 2024 г. |
Предостережение
Мы не рекомендуем использовать предварительные версии моделей в рабочей среде. Мы обновим все развертывания предварительных моделей либо до будущих версий, либо до последней стабильной общедоступной версии. Модели, назначенные предварительной версией, не соответствуют стандартному жизненному циклу модели OpenAI Azure.
Это важно
gpt-5.1reasoning_effortпо умолчанию равенnone. При обновлении с предыдущих моделей рассуждений доgpt-5.1, помните, что может потребоваться обновить ваш код, чтобы явно указать уровеньreasoning_effort, если вы хотите, чтобы произошло рассуждение.gpt-5.1-chatдобавляет встроенные возможности рассуждений. Как и другие модели причин , они не поддерживают такие параметрыtemperature. При переходе от использованияgpt-5-chat(которая не является моделью рассуждения) кgpt-5.1-chatубедитесь, что вы удаляете из кода все пользовательские параметры, такие какtemperature, которые не поддерживаются моделями рассуждения.gpt-5.1-codex-maxдобавляет поддержку установкиreasoning_effortдляxhigh. Использование рассуждательной возможностиnoneне поддерживаетсяgpt-5.1-codex-max.
GPT-5
Доступность по регионам
| Модель | Регион |
|---|---|
gpt-5 (2025-08-07) |
См. таблицу моделей. |
gpt-5-mini (2025-08-07) |
См. таблицу моделей. |
gpt-5-nano (2025-08-07) |
См. таблицу моделей. |
gpt-5-chat (2025-08-07) |
См. таблицу моделей. |
gpt-5-chat (2025-10-03) |
См. таблицу моделей. |
gpt-5-codex (2025-09-11) |
См. таблицу моделей. |
gpt-5-pro (2025-10-06) |
См. таблицу моделей. |
| Идентификатор модели | Description | Окно контекста | Максимальное количество выходных токенов | Учебные данные (вплоть до) |
|---|---|---|---|---|
gpt-5 (2025-08-07) |
-
Рассуждение — API завершения чата. - API ответов. — структурированные выходные данные. — Обработка текста и изображения. — Функции, инструменты и параллельные вызовы инструментов. - Полная сводка возможностей. |
400 000 Входные данные: 272 000 Результат: 128 000 |
128,000 | 30 сентября 2024 г. |
gpt-5-mini (2025-08-07) |
-
Рассуждение — API завершения чата. - API ответов. — структурированные выходные данные. — Обработка текста и изображения. — Функции, инструменты и параллельные вызовы инструментов. - Полная сводка возможностей. |
400 000 Входные данные: 272 000 Результат: 128 000 |
128,000 | 31 мая 2024 г. |
gpt-5-nano (2025-08-07) |
-
Рассуждение — API завершения чата. - API ответов. — структурированные выходные данные. — Обработка текста и изображения. — Функции, инструменты и параллельные вызовы инструментов. - Полная сводка возможностей. |
400 000 Входные данные: 272 000 Результат: 128 000 |
128,000 | 31 мая 2024 г. |
gpt-5-chat (2025-08-07)Preview |
— API завершения чата. - API ответов. - Входные данные: текст и изображение - Выходные данные: только текст |
128,000 | 16,384 | 30 сентября 2024 г. |
gpt-5-chat (2025-10-03)Предварительный просмотр1 |
— API завершения чата. - API ответов. - Входные данные: текст и изображение - Выходные данные: только текст |
128,000 | 16,384 | 30 сентября 2024 г. |
gpt-5-codex (2025-09-11) |
-
Только API ответов . - Входные данные: текст и изображение - Выходные данные: только текст — структурированные выходные данные. — Обработка текста и изображения. — Функции, инструменты и параллельные вызовы инструментов. - Полная сводка возможностей — Оптимизировано для расширения Codex CLI и Codex VS Code |
400 000 Входные данные: 272 000 Результат: 128 000 |
128,000 | - |
gpt-5-pro (2025-10-06) |
-
Рассуждение - API ответов. — структурированные выходные данные. — Обработка текста и изображения. — Функции и инструменты - Полная сводка возможностей. |
400 000 Входные данные: 272 000 Результат: 128 000 |
128,000 | 30 сентября 2024 г. |
Замечание
1gpt-5-chat версия 2025-10-03 представляет значительное улучшение, ориентированное на эмоциональный интеллект и возможности психического здоровья. Это обновление интегрирует специализированные наборы данных и усовершенствованные стратегии реагирования для улучшения способности модели:
- Узнайте и интерпретируйте эмоциональный контекст более точно, способствуя более тонким и эмпатическим взаимодействиям.
- Предоставляйте поддерживающие и ответственные ответы в разговорах, связанных с психическим здоровьем, обеспечивая деликатность и соблюдение лучших практик.
Эти улучшения стремятся сделать GPT-5-чат более учитывающим контекст, ориентированным на человека и надежным в сценариях, где важно учитывать эмоциональный тон и благополучие.
Предостережение
Мы не рекомендуем использовать предварительные версии моделей в рабочей среде. Мы обновим все развертывания предварительных моделей либо до будущих версий, либо до последней стабильной общедоступной версии. Модели, назначенные предварительной версией, не соответствуют стандартному жизненному циклу модели OpenAI Azure.
gpt-oss
Доступность по регионам
| Модель | Регион |
|---|---|
gpt-oss-120b |
Все Azure регионы OpenAI |
Capabilities
| Идентификатор модели | Description | Окно контекста | Максимальное количество выходных токенов | Учебные данные (вплоть до) |
|---|---|---|---|---|
gpt-oss-120b (предварительная версия) |
— только ввод/вывод текста — API завершения чата - Потоковое воспроизведение — Вызов функции — структурированные выходные данные -Рассуждение — доступно для развертывания1 и с помощью управляемых вычислений |
131,072 | 131,072 | 31 мая 2024 г. |
gpt-oss-20b (предварительная версия) |
— только ввод/вывод текста — API завершения чата - Потоковое воспроизведение — Вызов функции — структурированные выходные данные -Рассуждение — доступно с помощью managed compute и Foundry Local |
131,072 | 131,072 | 31 мая 2024 г. |
1 В отличие от других моделей OpenAI Azure gpt-oss-120b требуется проект Foundry для развертывания модели.
Развертывание с помощью кода
az cognitiveservices account deployment create \
--name "Foundry-project-resource" \
--resource-group "test-rg" \
--deployment-name "gpt-oss-120b" \
--model-name "gpt-oss-120b" \
--model-version "1" \
--model-format "OpenAI-OSS" \
--sku-capacity 10 \
--sku-name "GlobalStandard"
Серия GPT-4.1
Доступность по регионам
| Модель | Регион |
|---|---|
gpt-4.1 (2025-04-14) |
См. таблицу моделей. |
gpt-4.1-nano (2025-04-14) |
См. таблицу моделей. |
gpt-4.1-mini (2025-04-14) |
См. таблицу моделей. |
Capabilities
Это важно
Известная проблема влияет на все модели серии GPT 4.1. Крупные определения вызовов инструментов или функций, превышающие 300 000 токенов, приводят к сбоям, даже если не достигнут предел контекста модели в 1 млн токенов.
Ошибки могут отличаться на основе вызовов API и базовых характеристик полезных данных.
Ниже приведены сообщения об ошибках ДЛЯ API завершения чата:
Error code: 400 - {'error': {'message': "This model's maximum context length is 300000 tokens. However, your messages resulted in 350564 tokens (100 in the messages, 350464 in the functions). Please reduce the length of the messages or functions.", 'type': 'invalid_request_error', 'param': 'messages', 'code': 'context_length_exceeded'}}Error code: 400 - {'error': {'message': "Invalid 'tools[0].function.description': string too long. Expected a string with maximum length 1048576, but got a string with length 2778531 instead.", 'type': 'invalid_request_error', 'param': 'tools[0].function.description', 'code': 'string_above_max_length'}}
Ниже приведено сообщение об ошибке ДЛЯ API ответов:
Error code: 500 - {'error': {'message': 'The server had an error processing your request. Sorry about that! You can retry your request, or contact us through an Azure support request at: https://go.microsoft.com/fwlink/?linkid=2213926 if you keep seeing this error. (Please include the request ID d2008353-291d-428f-adc1-defb5d9fb109 in your email.)', 'type': 'server_error', 'param': None, 'code': None}}
| Идентификатор модели | Description | Окно контекста | Максимальное количество выходных маркеров | Обучающие данные (до определенного объема) |
|---|---|---|---|---|
gpt-4.1 (2025-04-14) |
— ввод текста и изображения — вывод текста — API завершения чата — API ответов - Потоковое воспроизведение — Вызов функции — структурированные выходные данные (завершение чата) |
- 1,047,576 — 128 000 (стандартные и зарезервированные управляемые развертывания) — 300 000 (пакетные развертывания) |
32,768 | 31 мая 2024 г. |
gpt-4.1-nano (2025-04-14) |
— ввод текста и изображения — вывод текста — API завершения чата — API ответов - Потоковое воспроизведение — Вызов функции — структурированные выходные данные (завершение чата) |
- 1,047,576 — 128 000 (стандартные и зарезервированные управляемые развертывания) — 300 000 (пакетные развертывания) |
32,768 | 31 мая 2024 г. |
gpt-4.1-mini (2025-04-14) |
— ввод текста и изображения — вывод текста — API завершения чата — API ответов - Потоковое воспроизведение — Вызов функции — структурированные выходные данные (завершение чата) |
- 1,047,576 — 128 000 (стандартные и зарезервированные управляемые развертывания) — 300 000 (пакетные развертывания) |
32,768 | 31 мая 2024 г. |
предварительный просмотр использования компьютера
Экспериментальная модель, обученная для использования с инструментом API ответов.
Его можно использовать с сторонними библиотеками, чтобы позволить модели управлять вводом мыши и клавиатуры, а также получать контекст из снимков экрана текущей среды.
Предостережение
Мы не рекомендуем использовать предварительные версии моделей в рабочей среде. Мы обновим все развертывания предварительных моделей либо до будущих версий, либо до последней стабильной общедоступной версии. Модели, назначенные предварительной версией, не соответствуют стандартному жизненному циклу модели OpenAI Azure.
Регистрация требуется для доступа к computer-use-preview. Доступ предоставляется на основе критериев соответствия корпорации Майкрософт. Клиенты, имеющие доступ к другим моделям ограниченного доступа, по-прежнему должны запрашивать доступ к этой модели.
Чтобы запросить доступ, перейдите в computer-use-preview приложение модели с ограниченным доступом. При предоставлении доступа необходимо создать развертывание для модели.
Доступность по регионам
| Модель | Регион |
|---|---|
computer-use-preview |
См. таблицу моделей. |
Capabilities
| Идентификатор модели | Description | Окно контекста | Максимальное количество выходных маркеров | Обучающие данные (до определенного объема) |
|---|---|---|---|---|
computer-use-preview (2025-03-11) |
Специализированная модель для использования с инструментом API ответов -Инструменты - Стриминг — Текст (входные и выходные данные) — изображение (входные данные) |
8,192 | 1,024 | Октябрь 2023 |
модели o-серии
Модели Azure OpenAI o-серии предназначены для решения задач рассуждения и решения проблем с повышенной фокусировкой и способностями. Эти модели тратят больше времени на обработку и понимание запроса пользователя, что делает их исключительно сильными в таких областях, как наука, программирование и математика, по сравнению с предыдущими итерациями.
| Идентификатор модели | Description | Максимальный запрос (токены) | Обучающие данные (до определенного объема) |
|---|---|---|---|
codex-mini (2025-05-16) |
Точно настроенная версия o4-mini. - API ответов. — структурированные выходные данные. — Обработка текста и изображения. — Функции и инструменты. Полная сводка возможностей. |
Входные данные: 200 000 Результат: 100 000 |
31 мая 2024 г. |
o3-pro (2025-06-10) |
-
API ответов. — структурированные выходные данные. — Обработка текста и изображения. — Функции и инструменты. Полная сводка возможностей. |
Входные данные: 200 000 Результат: 100 000 |
31 мая 2024 г. |
o4-mini (2025-04-16) |
-
Новая модель рассуждений, предлагающая расширенные возможности аргументирования. — API завершения чата. - API ответов. — структурированные выходные данные. — Обработка текста и изображения. — Функции и инструменты. Полная сводка возможностей. |
Входные данные: 200 000 Результат: 100 000 |
31 мая 2024 г. |
o3 (2025-04-16) |
-
Новая модель рассуждений, предлагающая расширенные возможности аргументирования. — API завершения чата. - API ответов. — структурированные выходные данные. — Обработка текста и изображения. — Функции, инструменты и параллельные вызовы инструментов. Полная сводка возможностей. |
Входные данные: 200 000 Результат: 100 000 |
31 мая 2024 г. |
o3-mini (2025-01-31) |
-
Расширенные способности рассудка. — структурированные выходные данные. — только текстовая обработка. — Функции и инструменты. |
Входные данные: 200 000 Результат: 100 000 |
Октябрь 2023 |
o1 (2024-12-17) |
-
Расширенные способности рассудка. — структурированные выходные данные. — Обработка текста и изображения. — Функции и инструменты. |
Входные данные: 200 000 Результат: 100 000 |
Октябрь 2023 |
o1-preview (2024-09-12) |
Более ранняя предварительная версия. | Вход: 128 000 Выход: 32 768 |
Октябрь 2023 |
o1-mini (2024-09-12) |
Более быстрый и более экономичный вариант в серии o1 идеально подходит для задач программирования, требующих скорости и снижения потребления ресурсов. — Глобальное развертывание уровня "Стандартный", доступное по умолчанию. — Стандартные (региональные) развертывания в настоящее время доступны только для пользователей, которые получили доступ в рамках выпуска o1-preview ограниченного доступа. |
Вход: 128 000 Результат: 65 536 |
Октябрь 2023 |
Дополнительные сведения о расширенных моделях серии o см. в статье "Начало работы с моделями причин".
Доступность по регионам
| Модель | Регион |
|---|---|
codex-mini |
East US2 и Sweden Central (глобальный стандарт). |
o3-pro |
East US2 и Sweden Central (глобальный стандарт). |
o4-mini |
См. таблицу моделей. |
o3 |
См. таблицу моделей. |
o3-mini |
См. таблицу моделей. |
o1 |
См. таблицу моделей. |
o1-preview |
См. таблицу моделей. Эта модель доступна только для клиентов, которым предоставлен доступ в рамках исходного ограниченного доступа. |
o1-mini |
См. таблицу моделей. |
GPT-4o и GPT-4 Turbo
GPT-4o интегрирует текст и изображения в одну модель, что позволяет одновременно обрабатывать несколько типов данных. Этот многомодальный подход повышает точность и скорость реагирования на взаимодействие с компьютером. GPT-4o соответствует GPT-4 Turbo в задачах английского текста и программирования, обеспечивая более высокую производительность в задачах, отличных от английского языка, и задачах визуального зрения, устанавливая новые тесты для возможностей искусственного интеллекта.
Модели GPT-4 и GPT-4 Turbo
Эти модели можно использовать только с API завершения чата.
Сведения о том, как Azure OpenAI обрабатывает обновления версий моделей, можно узнать в разделе «Версии моделей». Ознакомьтесь с моделями, чтобы узнать, как просматривать и настраивать параметры версии модели для развертываний GPT-4.
| Идентификатор модели | Description | Максимальный запрос (токены) | Обучающие данные (до определенного объема) |
|---|---|---|---|
gpt-4o (2024-11-20) GPT-4o (Omni) |
— структурированные выходные данные. — Обработка текста и изображения. — режим JSON. — параллельный вызов функций. — улучшенная точность и скорость реагирования. — Паритетность с английским текстом и задачами программирования по сравнению с GPT-4 Turbo с Vision. — высокая производительность на языках, отличных от английского языка, и в задачах визуального зрения. - Улучшенные творческие способности писать. |
Вход: 128 000 Выходные данные: 16 384 |
Октябрь 2023 |
gpt-4o (2024-08-06) GPT-4o (Omni) |
— структурированные выходные данные. — Обработка текста и изображения. — режим JSON. — параллельный вызов функций. — улучшенная точность и скорость реагирования. — Паритетность с английским текстом и задачами программирования по сравнению с GPT-4 Turbo с Vision. — высокая производительность на языках, отличных от английского языка, и в задачах визуального зрения. |
Вход: 128 000 Выходные данные: 16 384 |
Октябрь 2023 |
gpt-4o-mini (2024-07-18) GPT-4o mini |
— Быстрая, недорогая, способная модель, идеально подходящая для замены моделей серии GPT-3.5 Turbo. — Обработка текста и изображения. — режим JSON. — параллельный вызов функций. |
Вход: 128 000 Выходные данные: 16 384 |
Октябрь 2023 |
gpt-4o (2024-05-13) GPT-4o (Omni) |
— Обработка текста и изображения. — режим JSON. — параллельный вызов функций. — улучшенная точность и скорость реагирования. — Паритетность с английским текстом и задачами программирования по сравнению с GPT-4 Turbo с Vision. — высокая производительность на языках, отличных от английского языка, и в задачах визуального зрения. |
Вход: 128 000 Выходные данные: 4 096 |
Октябрь 2023 |
gpt-4 (turbo-2024-04-09) GPT-4 Turbo с визуальным модулем |
Новая общедоступная модель. — Замена всех предыдущих моделей GPT-4 ( vision-preview, 1106-Preview, 0125-Preview). - Доступность компонентов в настоящее время отличается в зависимости от метода ввода и типа развертывания. |
Вход: 128 000 Выходные данные: 4 096 |
Декабрь 2023 г. |
Предостережение
Мы не рекомендуем использовать предварительные версии моделей в рабочей среде. Мы обновим все развертывания предварительных моделей либо до будущих версий, либо до последней стабильной общедоступной версии. Модели, назначенные предварительной версией, не соответствуют стандартному жизненному циклу модели OpenAI Azure.
Embeddings
text-embedding-3-large является последней и самой способной моделью внедрения. Невозможно переключиться между моделями эмбеддингов. Чтобы перейти от использования text-embedding-ada-002 к text-embedding-3-large, необходимо создать новые эмбеддинги.
text-embedding-3-largetext-embedding-3-smalltext-embedding-ada-002
OpenAI сообщает, что тестирование показывает, что как большие, так и малые модели встраивания третьего поколения обеспечивают лучшую среднюю производительность для многоязычного извлечения с использованием бенчмарка MIRACL. Они по-прежнему сохраняют производительность при выполнении задач на английском языке по эталону MTEB.
| Эталон оценки | text-embedding-ada-002 |
text-embedding-3-small |
text-embedding-3-large |
|---|---|---|---|
| Среднее значение MIRACL | 31.4 | 44.0 | 54.9 |
| Среднее значение MTEB | 61.0 | 62.3 | 64.6 |
Модели внедрения третьего поколения поддерживают уменьшение размера внедрения с помощью нового dimensions параметра. Как правило, более крупные внедрения являются более дорогими с точки зрения вычислений, памяти и хранилища. При настройке количества измерений вы получаете больше контроля над общими затратами и производительностью. Параметр dimensions не поддерживается во всех версиях библиотеки openAI 1.x Python. Чтобы воспользоваться этим параметром, рекомендуется обновить до последней версии: pip install openai --upgrade
Тестирование тестов MTEB в OpenAI показало, что даже если размеры модели третьего text-embeddings-ada-002поколения сокращаются до меньше 1536 измерений, производительность остается немного лучше.
Модели создания изображений
Модели создания изображений создают изображения из текстовых запросов, которые предоставляет пользователь. Модели серии GPT-image-1 находятся в предварительной версии ограниченного доступа.
Регистрация требуется для доступа к gpt-image-1, gpt-image-1-mini или gpt-image-1.5. Доступ предоставляется на основе критериев соответствия корпорации Майкрософт. Клиенты, имеющие доступ к другим моделям ограниченного доступа, по-прежнему должны запрашивать доступ к этой модели.
Чтобы запросить доступ, заполните форму заявки: Подать заявку на доступ к GPT-image-1; Подать заявку на доступ к GPT-image-1.5. При предоставлении доступа необходимо создать развертывание для модели.
Доступность по регионам
| Модель | Регион |
|---|---|
gpt-image-1 |
Смотрите таблицу моделей |
gpt-image-1-mini |
Смотрите таблицу моделей |
gpt-image-1.5 |
Смотрите таблицу моделей |
Модели создания видео
Sora — это модель ИИ из OpenAI, которая может создавать реалистичные и образные видео сцены из текстовых инструкций. Sora находится в предварительной версии.
Доступность по регионам
| Модель | Регион |
|---|---|
sora |
Смотрите таблицу моделей |
sora-2 |
Смотрите таблицу моделей |
Звуковые модели
Звуковые модели в Azure OpenAI доступны через API realtime, completions и audio.
Aудиомодели GPT-4o
Звуковые модели GPT-4o являются частью семейства моделей GPT-4o и поддерживают низкую задержку, речь на входе, речь на выходе в разговорных взаимодействиях или звуковое поколение.
Предостережение
Мы не рекомендуем использовать предварительные версии моделей в рабочей среде. Мы обновим все развертывания предварительных моделей либо до будущих версий, либо до последней стабильной общедоступной версии. Модели, назначенные предварительной версией, не соответствуют стандартному жизненному циклу модели OpenAI Azure.
Сведения о максимальных маркерах запроса и обучающих данных доступны в следующей таблице:
| Идентификатор модели | Description | Максимальный запрос (токены) | Обучающие данные (до определенного объема) |
|---|---|---|---|
gpt-4o-mini-audio-preview (2024-12-17) |
Звуковая модель для создания звука и текста. | Вход: 128 000 Выходные данные: 16 384 |
Сентябрь 2023 г. |
gpt-4o-audio-preview (2024-12-17) |
Звуковая модель для создания звука и текста. | Вход: 128 000 Выходные данные: 16 384 |
Сентябрь 2023 г. |
gpt-4o-realtime-preview (2025-06-03) |
Звуковая модель для обработки звука в режиме реального времени. | Входные данные: 32 000 Выходные данные: 4 096 |
Октябрь 2023 |
gpt-4o-realtime-preview (2024-12-17) |
Звуковая модель для обработки звука в режиме реального времени. | Входные данные: 16 000 Выходные данные: 4 096 |
Октябрь 2023 |
gpt-4o-mini-realtime-preview (2024-12-17) |
Звуковая модель для обработки звука в режиме реального времени. | Вход: 128 000 Выходные данные: 4 096 |
Октябрь 2023 |
gpt-audio(28.08.2025)gpt-audio-mini(06.10.2025) |
Звуковая модель для создания звука и текста. | Входные данные: 128 00 Выходные данные: 16 384 |
Октябрь 2023 |
gpt-realtime (2025-08-28) (GA)gpt-realtime-mini (2025-10-06)gpt-realtime-mini (2025-12-15) |
Звуковая модель для обработки звука в режиме реального времени. | Входные данные: 32,00 Выходные данные: 4 096 |
Октябрь 2023 |
gpt-audio-1.5 (2026-02-23) |
Звуковая модель для создания звука и текста. | Входные данные: 128 00 Выходные данные: 16 384 |
Сентябрь 2024 г. |
gpt-realtime-1.5 (2026-02-23) |
Звуковая модель для обработки звука в режиме реального времени. | Входные данные: 32,00 Выходные данные: 4 096 |
Сентябрь 2024 г. |
Чтобы сравнить доступность звуковых моделей GPT-4o во всех регионах, см. таблицу моделей.
API для работы с аудио
Аудио-модели через API /audio можно использовать для преобразования речи в текст, перевода речи и преобразования текста в речь.
Модели преобразования речи в текст
| Идентификатор модели | Description | Максимальный запрос (размер аудиофайла) |
|---|---|---|
whisper |
Модель распознавания речи общего назначения. | 25 Мб |
gpt-4o-transcribe (2025-03-20) |
Модель преобразования речи в текст на основе GPT-4o. | 25 Мб |
gpt-4o-mini-transcribe (2025-03-20) |
Модель преобразования речи в текст с помощью GPT-4o mini. | 25 Мб |
gpt-4o-transcribe-diarize (2025-10-15) |
Модель преобразования речи в текст с автоматическим распознаванием речи. | 25 Мб |
gpt-4o-mini-transcribe (2025-12-15) |
Модель преобразования речи в текст с автоматическим распознаванием речи. Улучшена точность транскрибирования и надежность. | 25 Мб |
Модели перевода речи
| Идентификатор модели | Description | Максимальный запрос (размер аудиофайла) |
|---|---|---|
whisper |
Модель распознавания речи общего назначения. | 25 Мб |
Модели преобразования текста в речь (предварительная версия)
| Идентификатор модели | Description |
|---|---|
tts |
Модель преобразования текста в речь, оптимизированная для скорости. |
tts-hd |
Модель преобразования текста в речь, оптимизированная для качества. |
gpt-4o-mini-tts (2025-03-20) |
Модель преобразования текста в речь с помощью GPT-4o mini. Вы можете управлять голосом, чтобы говорить в определенном стиле или тоне. |
gpt-4o-mini-tts (2025-12-15) |
Модель преобразования текста в речь с помощью GPT-4o mini. Вы можете управлять голосом, чтобы говорить в определенном стиле или тоне. |
Сводка модели и доступность в регионе
Модели по типу развертывания
Azure OpenAI предоставляет клиентам выбор в структуре размещения, которая соответствует своим бизнес-шаблонам и шаблонам использования. Служба предлагает два основных типа развертывания:
- Стандарт: имеет глобальный вариант развертывания, маршрутизация трафика глобально для обеспечения более высокой пропускной способности.
- Provisioned: также имеет опцию глобального развертывания, позволяющую клиентам приобретать и развертывать зарезервированные единицы пропускной способности в глобальной инфраструктуре Azure.
Все развертывания могут выполнять те же операции вывода данных, но оплата, масштабируемость и производительность существенно отличаются. Дополнительные сведения о типах развертывания OpenAI в Azure вы можете найти в нашем руководстве по типам развертывания.
- Глобальный стандарт
- Глобальная управляемая конфигурация
- Глобальный пакет
- Стандарт зоны данных
- Подготовленная управляемая зона данных
- Пакет зоны данных
- Стандарт
- Сконфигурированное управляемое
Доступность глобальной стандартной модели
| Регион | gpt-5.4-mini, 2026-03-17 | gpt-5.4-nano, 2026-03-17 | gpt-5.4, 2026-03-05 | gpt-5.4-pro, 2026-03-05 | gpt-5.3-chat, 2026-03-03 | gpt-5.3-codex, 2026-02-24 | gpt-audio-1.5, 2026-02-23 | gpt-realtime-1.5, 2026-02-23 | gpt-5.2-chat, 2026-02-10 | gpt-5.2-codex, 2026-01-14 | gpt-image-1.5, 2025-12-16 | gpt-4o-mini-transcribe, 2025-12-15 | gpt-4o-mini-tts, 2025-12-15 | gpt-audio-mini, 2025-12-15 | gpt-realtime-mini, 2025-12-15 | gpt-5.2, 2025-12-11 | gpt-5.2-chat, 2025-12-11 | gpt-5.1-codex-max, 2025-12-04 | модель-маршрутизатор, 2025-11-18 | gpt-5.1, 2025-11-13 | gpt-5.1-chat, 2025-11-13 | gpt-5.1-codex, 2025-11-13 | gpt-5.1-codex-mini, 2025-11-13 | gpt-4o-transcribe-diarize, 2025-10-15 | gpt-5-pro, 2025-10-06 | gpt-audio-mini, 2025-10-06 | gpt-image-1-mini, 2025-10-06 | gpt-realtime-mini, 2025-10-06 | sora-2, 2025-10-06 | gpt-5-chat, 2025-10-03 | gpt-5-codex, 2025-09-15 | gpt-audio, 2025-08-28 | gpt-realtime, 2025-08-28 | gpt-5, 2025-08-07 | gpt-5-chat, 2025-08-07 | gpt-5-mini, 2025-08-07 | gpt-5-nano, 2025-08-07 | Модель маршрутизатора, 2025-08-07 | o3-deep-research, 2025-06-26 | o3-pro, 2025-06-10 | модель-маршрутизатор, 2025-05-19 | codex-mini, 2025-05-16 | sora, 2025-05-02 | o3, 2025-04-16 | o4-mini, 2025-04-16 | gpt-image-1, 2025-04-15 | gpt-4.1, 2025-04-14 | gpt-4.1-mini, 2025-04-14 | gpt-4.1-nano, 2025-04-14 | gpt-4o-mini-transcribe, 2025-03-20 | gpt-4o-mini-tts, 2025-03-20 | gpt-4o-transcribe, 2025-03-20 | предварительный просмотр использования компьютера, 11.03.2025 | o3-mini, 2025-01-31 | gpt-4o-audio-preview, 2024-12-17 | gpt-4o-mini-audio-preview, 2024-12-17 | gpt-4o-mini-realtime-preview, 2024-12-17 | gpt-4o-realtime-preview, 2024-12-17 | o1, 2024-12-17 | gpt-4o, 2024-11-20 | gpt-4o, 2024-08-06 | gpt-4o-mini, 2024-07-18 | gpt-4o, 2024-05-13 | text-embedding-ada-002, 2 | text-embedding-3-large, 1 | text-embedding-3-small, 1 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| австралиявосток | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Бразильский Юг | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Центральная Канада | - | - | - | - | - | - | - | ✅ | - | - | - | ✅ | - | - | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | - | ✅ | ✅ | - | ✅ | - | ✅ | - | - | - | - | - | - | - | - | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | - | - | - | - |
| Канада Восток | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Центральус | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | ✅ | - | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | - | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ |
| Истус | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | - | ✅ | - | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| eastus2 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| francecentral | - | - | - | - | - | - | - | ✅ | - | - | - | ✅ | - | - | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Германия-запад-центр | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| северная италия | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ |
| japaneast | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| koreacentral | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Northcentralus | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Норвегия Восток | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Польша Центральная | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ | - | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Южная Африка-север | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| СаутЦентралус | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| southeastasia | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | ✅ | ✅ | - | - | - | - |
| Южная Индия | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| spaincentral | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| SwedenCentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Швейцария север | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| switzerlandwest | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | - | - | ✅ | ✅ | - | - | - | ✅ | - | - | - | - | - | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | ✅ | ✅ | - | - | - | - |
| uaenorth | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| UKSOUTH | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Западная Европа | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Вестус | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| westus3 | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | - | - | ✅ | - | - | - | - | - | - | ✅ | - | ✅ | ✅ | - | - | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
Замечание
o3-deep-research доступен только с Foundry Agent Service. Дополнительные сведения см. в руководстве по глубокому исследованию.
Эта таблица не содержит сведения о точной настройке региональной доступности. Ознакомьтесь с разделом по тонкой настройке для получения этой информации.
Модели встраивания
Эти модели можно использовать только с запросами API внедрения.
Замечание
text-embedding-3-large является последней и самой способной моделью внедрения. Невозможно обновить между моделями внедрения. Чтобы выполнить миграцию с использования text-embedding-ada-002text-embedding-3-large, необходимо создать новые внедрения.
| Идентификатор модели | Максимальный запрос (токены) | Измерения выходных данных | Обучающие данные (до определенного объема) |
|---|---|---|---|
text-embedding-ada-002 (версия 2) |
8,192 | 1,536 | Сентябрь 2021 г. |
text-embedding-ada-002 (версия 1) |
2,046 | 1,536 | Сентябрь 2021 г. |
text-embedding-3-large |
8,192 | 3,072 | Сентябрь 2021 г. |
text-embedding-3-small |
8,192 | 1,536 | Сентябрь 2021 г. |
Замечание
При отправке массива входных данных для внедрения максимальное количество входных элементов в массиве на вызов конечной точки внедрения составляет 2048.
Модели создания изображений
| Идентификатор модели | Максимальный запрос (символы) |
|---|---|
gpt-image-1 |
4,000 |
gpt-image-1-mini |
4,000 |
gpt-image-1.5 |
4,000 |
Модели создания видео
| Идентификатор модели | Максимальная длина запроса (в символах) |
|---|---|
| sora | 4,000 |
Тонкая настройка моделей
Для точной настройки поддерживаются следующие модели:
| Идентификатор модели | Стандартные регионы | Глобальный | Developer | Методы | Статус | Modality |
|---|---|---|---|---|---|---|
gpt-4o-mini (2024-07-18) |
Северная часть США Центральная Швеция |
✅ | ✅ | SFT | GA | Текст в текст |
gpt-4o (2024-08-06) |
Восточная часть США2 Северная часть США Центральная Швеция |
✅ | ✅ | СФТ, ДПО | GA | Текст и преобразование изображений в текст |
gpt-4.1 (2025-04-14) |
Северная часть США Центральная Швеция |
✅ | ✅ | СФТ, ДПО | GA | Текст и преобразование изображений в текст |
gpt-4.1-mini (2025-04-14) |
Северная часть США Центральная Швеция |
✅ | ✅ | СФТ, ДПО | GA | Текст в текст |
gpt-4.1-nano (2025-04-14) |
Северная часть США Центральная Швеция |
✅ | ✅ | СФТ, ДПО | GA | Текст в текст |
o4-mini (2025-04-16) |
Восточная часть США2 Центральная Швеция |
✅ | ❌ | RFT | GA | Текст в текст |
gpt-5 (2025-08-07) |
Северная часть США Центральная Швеция |
✅ | ✅ | RFT | Частная предварительная версия | Текст в текст |
Ministral-3B (2411) |
Не поддерживается | ✅ | ❌ | SFT | Общедоступная предварительная версия | Текст в текст |
Qwen-32B |
Не поддерживается | ✅ | ❌ | SFT | Общедоступная предварительная версия | Текст в текст |
Llama-3.3-70B-Instruct |
Не поддерживается | ✅ | ❌ | SFT | Общедоступная предварительная версия | Текст в текст |
gpt-oss-20b |
Не поддерживается | ✅ | ❌ | SFT | Общедоступная предварительная версия | Текст в текст |
Или можно точно настроить ранее настраиваемую модель, отформатированную как base-model.ft-{jobid}.
Замечание
Модели с открытым кодом (Ministral-3B, Qwen-32B, Llama-3.3-70B-Instruct, gpt-oss-20b) поддерживаются только в ресурсах Foundry и в новом пользовательском интерфейсе Foundry.
Замечание
Глобальное обучение обеспечивает более доступную стоимость обучения за токен, но не предлагает размещение данных на месте. В настоящее время он доступен для ресурсов Foundry в следующих регионах:
- Australia East
- Бразилия (Юг)
- Центральная Канада
- Canada East
- Восток США
- Восток США2
- Центральная Франция
- Западно-Центральная Германия
- Северная Италия
- Восточная Япония (нет поддержки зрения)
- Центральная Корея
- северо-центральная часть США
- Norway East
- Центральная Польша (нет поддержки 4.1-nano)
- Юго-Восточная Азия
- Север Южной Африки
- Южно-Центральный регион США
- Южная Индия
- Spain Central
- Центральная Швеция
- Switzerland West
- Switzerland North
- UK South
- West Europe
- Западная часть США
- Западная часть США3
Помощники (предварительная версия)
Для помощников требуется сочетание поддерживаемой модели и поддерживаемого региона. Для некоторых инструментов и возможностей требуются последние модели. Следующие модели доступны в API Помощников, пакете SDK и Foundry. Следующая таблица предназначена для стандартного развертывания. Сведения о доступности подготовленной единицы пропускной способности см. в разделе "Подготовленная пропускная способность". Перечисленные модели и регионы можно использовать как с помощниками версии 1, так и с версией 2. Вы можете использовать Global Standard модели, если они поддерживаются в следующих регионах.
| Регион | gpt-4o, 2024-05-13 | gpt-4o, 2024-08-06 | gpt-4o-mini, 2024-07-18 | gpt-4, 0613 | gpt-4, 1106-Предварительный просмотр | gpt-4, 0125-Предварительная версия | gpt-4, turbo-2024-04-09 | gpt-4-32k, 0613 | gpt-35-turbo, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 | gpt-35-turbo-16k, 0613 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| австралиявосток | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ |
| Истус | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | ✅ | - | ✅ | ✅ |
| eastus2 | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | ✅ | - | ✅ | ✅ |
| francecentral | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | ✅ |
| japaneast | - | - | - | - | - | - | - | - | ✅ | - | ✅ | ✅ |
| Норвегия Восток | - | - | - | - | ✅ | - | - | - | - | - | - | - |
| Южная Индия | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | - |
| SwedenCentral | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | - | ✅ |
| UKSOUTH | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ |
| Вестус | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | - | ✅ | ✅ | - |
| westus3 | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | - | - | ✅ | - |
Вывод модели из эксплуатации
Последние сведения о выводе моделей из эксплуатации см. в руководстве по выводу моделей из эксплуатации.
Связанный контент
Замечание
Модели Foundry, проданные непосредственно Azure также включают все Azure модели OpenAI. Чтобы узнать об этих моделях, перейдите в коллекцию OpenAI модели Azure в начале этой статьи.
Модели Black Forest Labs, проданные непосредственно Azure
Модели FLUX компании Black Forest Labs (BFL) обеспечивают современные возможности генерации изображений в Microsoft Foundry, позволяя вам создавать и редактировать высококачественные изображения на основе текстовых запросов и эталонных изображений. Модели FLUX поддерживают ряд возможностей, включая создание изображений по текстовому описанию, редактирование многоссылочного изображения, а также генерация и редактирование в контексте.
Эти модели можно запускать с помощью API поставщика услуг BFL и через конечные точки images/generations и images/edits.
Сведения о работе с моделями FLUX в Foundry см. в статье "Развертывание и использование моделей FLUX в Microsoft Foundry".
| Модель | Тип и конечная точка API | Capabilities | Тип развертывания (доступность региона) |
|---|---|---|---|
FLUX.2-flex |
Генерирование изображений - API поставщика услуг BFL: <resource-name>/providers/blackforestlabs/v1/flux-2-flex |
-
Входные данные: текст и изображение (32 000 маркеров и до 10 изображенийi) - Вывод: Одно изображение - Вызов инструмента: Нет - Форматы ответов: Изображение (PNG и JPG) - Ключевые функции: Точное управление; Поддержка нескольких ссылок для до 10 образов - Дополнительные параметры: guidance: определяет, насколько тесно выходные данные соответствуют запросу. Минимум: 1.5, максимум: 10, по умолчанию: 4.5. Выше = более близкое следование указаниям. steps: количество шагов вывода. Максимум: 50, по умолчанию: 50. Выше = больше подробностей, медленнее. |
— глобальный стандарт (все регионы) |
FLUX.2-pro |
Генерирование изображений - API поставщика услуг BFL: <resource-name>/providers/blackforestlabs/v1/flux-2-pro |
-
Входные данные: текст и изображение (32 000 маркеров и до 8 изображенийii) - Вывод: Одно изображение - Вызов инструмента: Нет - Форматы ответов: Изображение (PNG и JPG) - Ключевые функции: Поддержка множественных ссылок для до 8 изображений; более обоснованное на реальных данных; большая гибкость в выводе данных; улучшенная производительность - Дополнительные параметры:(Только ДЛЯ API для конкретного поставщика) Поддерживает все параметры. |
— глобальный стандарт (все регионы) |
FLUX.1-Kontext-pro |
Генерирование изображений - API изображений: https://<resource-name>/openai/deployments/{deployment-id}/images/generations и https://<resource-name>/openai/deployments/{deployment-id}/images/edits - API поставщика услуг BFL: <resource-name>/providers/blackforestlabs/v1/flux-kontext-pro?api-version=preview |
-
Входные данные: текст и изображение (5000 маркеров и 1 изображение) - Вывод: Одно изображение - Вызов инструмента: Нет - Форматы ответов: Изображение (PNG и JPG) - Ключевые функции: Согласованность символов, расширенное редактирование - Дополнительные параметры:(Только api для конкретного поставщика) seed, aspect ratio, , input_image, prompt_unsampling, safety_toleranceoutput_format |
— глобальный стандарт (все регионы) |
FLUX-1.1-pro |
Генерирование изображений - API изображений: https://<resource-name>/openai/deployments/{deployment-id}/images/generations - API поставщика услуг BFL: <resource-name>/providers/blackforestlabs/v1/flux-pro-1.1?api-version=preview |
-
Входные данные: текст (5000 маркеров и 1 изображение) - Вывод: Одно изображение - Вызов инструмента: Нет - Форматы ответов: Изображение (PNG и JPG) - Ключевые функции: Быстрый вывод, строгое соблюдение запросов, конкурентное ценообразование, масштабируемая генерация - Дополнительные параметры:(Только api для конкретного поставщика) width, height, , prompt_unsampling, seed, safety_toleranceoutput_format |
— глобальный стандарт (все регионы) |
i,ii Поддержка нескольких эталонных образов доступна для FLUX.2 [pro] и FLUX.2 [flex] с помощью API, но не на детской площадке.
См . эту коллекцию моделей на портале Microsoft Foundry.
модели Cohere, продаваемые самим Azure
Семейство моделей Cohere включает различные модели, оптимизированные для различных вариантов использования, включая завершение чата, переранжирование/классификацию текста и векторные представления. Модели Cohere оптимизированы для различных вариантов использования, включающих причины, сводку и ответы на вопросы.
| Модель | Тип | Capabilities | Тип развертывания (доступность региона) |
|---|---|---|---|
| Cohere-rerank-v4.0-pro | классификация текста (пересортировка) |
-
Входные данные: текст - Выходные данные: текст - Языки: en, fresitdept-brjazh-cnarvi, , hiruidnl - Вызов инструмента: Нет - Форматы ответов: JSON |
— глобальный стандарт (все регионы) — Управляемые вычисления |
| Cohere-rerank-v4.0-fast | классификация текста (пересортировка) |
-
Входные данные: текст - Выходные данные: текст - Языки: en, fresitdept-brjazh-cnarvi, , hiruidnl - Вызов инструмента: Нет - Форматы ответов: JSON |
— глобальный стандарт (все регионы) — Управляемые вычисления |
Cohere-command-a |
chat-completion |
-
Входные данные: текст (131 072 токенов) - Выходные данные: текст (8 182 токенов) языки - : en, fr, es, it, de, pt-br, ja, ko, zh-cnи ar - Вызов инструмента: Да - Форматы ответов: Текст, JSON |
— глобальный стандарт (все регионы) |
embed-v-4-0 |
embeddings |
-
Входные данные: текст (512 токенов) и изображения (2MM пикселей) - Вывод: Вектор (256, 512, 1024, 1536 размерности) языки - : en, fr, es, it, de, pt-br, ja, ko, zh-cnи ar |
— глобальный стандарт (все регионы) |
См. коллекцию моделей Cohere на портале Foundry.
Модели DeepSeek, которые непосредственно продаются компанией Azure
Семейство моделей DeepSeek включает в себя несколько моделей рассуждений, которые превосходно справляются с задачами на рассуждение благодаря пошаговому процессу обучения, таким как языковые, научные рассуждения и программирование.
| Модель | Тип | Capabilities | Тип развертывания (доступность региона) |
|---|---|---|---|
DeepSeek-V3.2-Speciale |
chat-completion (с обоснованием) |
-
Входные данные: текст (128 000 токенов) - Выходные данные: текст (128 000 маркеров) - Языки: en и zh - Вызов инструмента: Нет - Форматы ответов: Текст, JSON |
— глобальный стандарт (все регионы) |
DeepSeek-V3.2 |
chat-completion (с обоснованием) |
-
Входные данные: текст (128 000 токенов) - Выходные данные: текст (128 000 маркеров) - Языки: en и zh - Вызов инструмента: Нет - Форматы ответов: Текст, JSON |
— глобальный стандарт (все регионы) |
DeepSeek-V3.1 |
chat-completion (с обоснованием) |
-
Входные данные: текст (131 072 токенов) - Выходные данные: текст (131 072 токенов) - Языки: en и zh - Вызов инструмента: Да - Форматы ответов: Текст, JSON |
— глобальный стандарт (все регионы) |
DeepSeek-R1-0528 |
chat-completion (с обоснованием) |
-
Входные данные: текст (163 840 токенов) - Выходные данные: текст (163 840 токенов) - Языки: en и zh - Вызов инструмента: Нет - Форматы ответов: текст |
— глобальный стандарт (все регионы) — предоставленные в глобальном масштабе (во всех регионах) |
DeepSeek-V3-0324 |
chat-completion |
-
Входные данные: текст (131 072 токенов) - Выходные данные: текст (131 072 токенов) - Языки: en и zh - Вызов инструмента: Да - Форматы ответов: Текст, JSON |
— глобальный стандарт (все регионы) — предоставленные в глобальном масштабе (во всех регионах) |
DeepSeek-R1 |
chat-completion (с обоснованием) |
-
Входные данные: текст (163 840 токенов) - Выходные данные: текст (163 840 токенов) - Языки: en и zh - Вызов инструмента: Нет - Форматы ответов: текст |
— глобальный стандарт (все регионы) — предоставленные в глобальном масштабе (во всех регионах) |
См. эту коллекцию моделей на портале Foundry.
Метамодели, продаваемые непосредственно Azure
Модели и инструменты Meta Llama — это коллекция предварительно обученных и точно настроенных генеративных моделей ИИ для работы с текстами и изображениями. Диапазон метамоделей варьируется по масштабу, чтобы включать:
- Небольшие языковые модели (SLM), такие как 1B и 3B Base и модели Instruct, для вывода на устройствах и выводов на периферии.
- Средние крупные языковые модели (LLMs), такие как 7B, 8B и 70B Base и модели Instruct
- Высокопроизводительные модели, такие как Meta Llama 3.1-405B для создания искусственных данных и случаев использования дистилляции.
| Модель | Тип | Capabilities | Тип развертывания (доступность региона) |
|---|---|---|---|
Llama-4-Maverick-17B-128E-Instruct-FP8 |
chat-completion |
-
Входные данные: текст и изображения (маркеры 1M) - Выходные данные: текст (1 млн токенов) - Языки: ar, enfrdehiiditptes, и tlthvi - Вызов инструмента: Нет - Форматы ответов: текст |
— глобальный стандарт (все регионы) |
Llama-3.3-70B-Instruct |
chat-completion |
-
Входные данные: текст (128 000 токенов) - Выходные данные: текст (8 192 токенов) языки - : en, de, fr, it, pt, hi, esи th - Вызов инструмента: Нет - Форматы ответов: текст |
— глобальный стандарт (все регионы) — предоставленные в глобальном масштабе (во всех регионах) |
См. эту коллекцию моделей на портале Foundry. Вы также можете найти несколько моделей Meta, доступных от партнеров и сообщества.
Модели Майкрософт, проданные непосредственно Azure
Модели Майкрософт включают различные группы моделей, такие как маршрутизатор модели, модели MAI, модели Phi, модели для здравоохранения и многое другое. См . коллекцию моделей Майкрософт на портале Foundry. Вы также можете найти несколько моделей Майкрософт, доступных от партнеров и сообщества.
| Модель | Тип | Capabilities | Тип развертывания (доступность региона) |
|---|---|---|---|
| модель роутера1 | chat-completion | Дополнительные сведения в разделе Обзор маршрутизатора Model. - Входные данные: текст, изображение - Выходные данные: текст (максимальное количество выходных токенов варьируется2) Окно контекста: 200 0003 - Языки: en |
- Глобальный стандарт (восточная часть США 2, Центральная Швеция) — Зона данных стандарта4 (восточная часть США 2, Центральная Швеция) |
MAI-DS-R1 |
chat-completion (с обоснованием) |
-
Входные данные: текст (163 840 токенов) - Выходные данные: текст (163 840 токенов) - Языки: en и zh - Вызов инструмента: Нет - Форматы ответов: текст |
— глобальный стандарт (все регионы) |
1Версия маршрутизатора2025-11-18. Более ранние версии (2025-08-07 и 2025-05-19) также доступны.
2Максимальное количество токенов на выходе зависит от базовых моделей в маршрутизаторе модели. Например, 32 768 (), 100 000 (GPT-4.1 series), 128 000 (o4-minigpt-5 reasoning models) и 16 384 (gpt-5-chat).
3 Более крупные контекстные окна совместимы с некоторыми базовыми моделями маршрутизатора модели. Это означает, что вызов API с большим контекстом завершается успешно, только если запрос перенаправляется в одну из таких моделей. В противном случае вызов завершается ошибкой.
4 Выставление счетов за развертывание маршрутизаторов модели "Стандартный" для зоны данных начинается не раньше 1 ноября 2025 г.
Модели Mistral, продаваемые напрямую компанией Azure
| Модель | Тип | Capabilities | Тип развертывания (доступность региона) |
|---|---|---|---|
mistral-document-ai-2512 |
Изображение к тексту |
-
Входные данные: изображения или PDF-страницы (30 страниц, максимум 30 МБ PDF-файла) - Выходные данные: текст - Языки: en - Вызов инструмента: нет - Форматы ответов: Текст, JSON, Markdown |
— глобальный стандарт (все регионы) — стандарт зоны данных (США и ЕС) |
mistral-document-ai-2505 |
Изображение к тексту |
-
Входные данные: изображения или PDF-страницы (30 страниц, максимум 30 МБ PDF-файла) - Выходные данные: текст - Языки: en - Вызов инструмента: нет - Форматы ответов: Текст, JSON, Markdown |
— глобальный стандарт (все регионы) — стандарт зоны данных (США и ЕС) |
Mistral-Large-3 |
chat-completion |
-
Входные данные: текст, изображение - Выходные данные: текст языки - : en, fr, de, es, it, pt, nl, zh, ja, koи ar - Вызов инструмента: Да - Форматы ответов: Текст, JSON |
— глобальный стандарт (все регионы) — стандарт зоны данных (США и ЕС) |
См. коллекцию моделей Mistral на портале Foundry. Вы также можете найти несколько моделей Мистраля , доступных от партнеров и сообщества.
Модели ИИ Moonshot, продаваемые непосредственно от Azure
Модели Moonshot AI включают Kimi K2.5 и Kimi K2 Thinking. Кими K2.5 является многомодальной моделью рассуждений, которая принимает ввод текста и изображения, в то время как Кими K2 Мышление является последней, наиболее способной версией модели мышления с открытым исходным кодом.
| Модель | Тип | Capabilities | Тип развертывания (доступность региона) |
|---|---|---|---|
Kimi-K2.5 |
chat-completion (с обоснованием) |
-
Входные данные: текст и изображение (262 144 токенов) - Выходные данные: текст (262 144 токена) - Языки: en и zh - Вызов инструмента: Да - Форматы ответов: текст |
— глобальный стандарт (все регионы) |
Kimi-K2-Thinking |
chat-completion (с обоснованием) |
-
Входные данные: текст (262 144 токена) - Выходные данные: текст (262 144 токена) - Языки: en и zh - Вызов инструмента: Да - Форматы ответов: текст |
— глобальный стандарт (все регионы) |
См. эту коллекцию моделей на портале Foundry.
Модели xAI, проданные непосредственно Azure
Модели Grok в Foundry Models включают разнообразный набор моделей рассуждения и нерассуждения, предназначенных для корпоративных сценариев использования, таких как извлечение данных, кодирование, суммирование текста и агентные приложения.
Регистрация требуется для доступа кgrok-code-fast-1 и grok-4.
| Модель | Тип | Capabilities | Тип развертывания (доступность региона) |
|---|---|---|---|
grok-4.1-fast-reasoning |
chat-completion |
-
Входные данные: текст, изображение (128 000 токенов) - Выходные данные: текст (128 000 маркеров) - Языки: en - Вызов инструмента: да - Форматы ответов: текст |
— глобальный стандарт (все регионы) |
grok-4.1-fast-non-reasoning |
chat-completion |
-
Входные данные: текст, изображение (128 000 токенов) - Выходные данные: текст (128 000 маркеров) - Языки: en - Вызов инструмента: да - Форматы ответов: текст |
— глобальный стандарт (все регионы) |
grok-4 |
chat-completion |
-
Входные данные: текст (262 000 токенов) - Выходные данные: текст (8 192 токенов) - Языки: en - Вызов инструмента: да - Форматы ответов: текст |
— глобальный стандарт (все регионы) |
grok-4-fast-reasoning |
chat-completion |
-
Входные данные: текст, изображение (128 000 токенов) - Выходные данные: текст (128 000 маркеров) - Языки: en - Вызов инструмента: да - Форматы ответов: текст |
— глобальный стандарт (все регионы) — стандарт зоны данных (США) |
grok-4-fast-non-reasoning |
chat-completion |
-
Входные данные: текст, изображение (128 000 токенов) - Выходные данные: текст (128 000 маркеров) - Языки: en - Вызов инструмента: да - Форматы ответов: текст |
— глобальный стандарт (все регионы) — стандарт зоны данных (США) |
grok-code-fast-1 |
chat-completion |
-
Входные данные: текст (256 000 маркеров) - Выходные данные: текст (8 192 токенов) - Языки: en - Вызов инструмента: да - Форматы ответов: текст |
— глобальный стандарт (все регионы) |
grok-3 |
chat-completion |
-
Входные данные: текст (131 072 токенов) - Выходные данные: текст (131 072 токенов) - Языки: en - Вызов инструмента: да - Форматы ответов: текст |
— глобальный стандарт (все регионы) — стандарт зоны данных (США) |
grok-3-mini |
chat-completion |
-
Входные данные: текст (131 072 токенов) - Выходные данные: текст (131 072 токенов) - Языки: en - Вызов инструмента: да - Форматы ответов: текст |
— глобальный стандарт (все регионы) — стандарт зоны данных (США) |
См . коллекцию моделей xAI на портале Foundry.
Доступность региона модели по типу развертывания
Модели Foundry позволяют выбрать структуру размещения, которая соответствует вашим бизнес-шаблонам и шаблонам использования. Служба предлагает два основных типа развертывания:
- Стандарт: имеет глобальный вариант развертывания, маршрутизация трафика глобально для обеспечения более высокой пропускной способности.
- Provisioned: также имеет глобальный вариант развертывания, позволяющий приобрести и развернуть зарезервированные единицы пропускной способности в глобальной инфраструктуре Azure.
Все развертывания выполняют одни и те же операции вывода, но выставление счетов, масштабирование и производительность отличаются. Дополнительные сведения о типах развертывания см. в разделе "Типы развертывания" в модели Foundry.
Доступность глобальной стандартной модели
| Регион | cohere-command-a | Cohere-rerank-v4.0-fast | Cohere-rerank-v4.0-pro | embed-v-4-0 | DeepSeek-R1 | DeepSeek-R1-0528 | DeepSeek-V3-0324 | DeepSeek-V3.1 | DeepSeek-V3.2 | DeepSeek-V3.2-Speciale | FLUX-1.1-pro | FLUX.1-Kontext-pro | FLUX.2-pro | grok-3 | grok-3-mini | grok-4-fast-non-reasoning | грок-4-быстрое-рассуждение | grok-4.1-без-рассуждений-быстрый | grok-4.1-fast-reasoning | Kimi-K2-Thinking | Кими-K2.5 | Llama-3.3-70B-Instruct | Llama-4-Maverick-17B-128E-Instruct-FP8 | MAI-DS-R1 | Мета-Лама-3-70B-Instruct | Мета-Лама-3-70B-Instruct | Мета-Лама-3-70B-Instruct | Мета-Лама-3-70B-Instruct | mistral-document-ai-2505 | mistral-document-ai-2512 | Mistral-Large-3 | model-router |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| австралиявосток | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| Бразильский Юг | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| Центральная Канада | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| Канада Восток | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| Центральус | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| Истус | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| eastus2 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| francecentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| Германия-запад-центр | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| северная италия | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| japaneast | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| Запад Японии | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| koreacentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| Northcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| Норвегия Восток | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| Польша Центральная | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| Южная Африка-север | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| СаутЦентралус | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| Южная Индия | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| spaincentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| SwedenCentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Швейцария север | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| switzerlandwest | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| uaenorth | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| UKSOUTH | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| westcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| Западная Европа | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| Вестус | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| westus2 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| westus3 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |