Модели Foundry, предлагаемые Azure

Модели Microsoft Foundry в каталоге моделей включают две основные категории, а именно модели Foundry, продаваемые через Azure и модели Foundry от партнеров и сообщества. В этой статье перечислены некоторые модели Foundry, предлагаемые Azure, а также их возможности, типы развертывания и доступные регионы, не включая устаревшие и выведенные из эксплуатации модели. Модели Foundry, продаваемые Azure, также называются Direct from Azure Models или Azure Direct Models.

Модели, проданные Azure, также размещаются Azure и управляются Azure в рамках службы Foundry Models. Они включают все Azure модели OpenAI и определенные, выбранные модели из лучших поставщиков. Эти модели оплачиваются через вашу подписку на Azure, покрываются условиями соглашений об уровне обслуживания Azure и поддерживаются Microsoft. Список моделей Foundry, поддерживаемых службой агентов Foundry, см. в разделе " Модели, поддерживаемые службой агента", а также список моделей Foundry от партнеров, см. в разделе "Модели Foundry" от партнеров и сообщества.

Совет

Используйте вкладки в верхней части этой страницы, чтобы переключаться между моделями Azure OpenAI и Other model collections от поставщиков, таких как Cohere, DeepSeek, Meta, Mistral AI и xAI.

Azure OpenAI в моделях Microsoft Foundry

Azure OpenAI работает с различным набором моделей с разными возможностями и ценовыми точками. Доступность модели зависит от региона и облака.

Чтобы узнать о доступности регионов для Azure OpenAI в моделях Microsoft Foundry, сгруппированных по категориям развертывания, см. раздел Доступность по регионам для моделей Foundry, предлагаемых через Azure.
Сведения о доступности модели Azure для государственных организаций см. в Azure OpenAI в Azure для государственных организаций.

Основные моменты модели

Модели	Описание
GPT-chat-latest (предварительная версия)	НОВЫЕ ФУНКЦИИ`gpt-chat-latest`Предварительный просмотр
Серия GPT-5.5	Новые функции`gpt-5.5`
Серия GPT-5.4	`gpt-5.4-mini`, `gpt-5.4-nano`, `gpt-5.4`, `gpt-5.4-pro`
Серия GPT-5.3	`gpt-5.3-chat`, `gpt-5.3-codex`
Серия GPT-5.2	`gpt-5.2-codex`, , `gpt-5.2gpt-5.2-chat`предварительная версия
Серия GPT-5.1	`gpt-5.1`, `gpt-5.1-chat`предварительная версия, , `gpt-5.1-codexgpt-5.1-codex-mini`
Сора	НОВАЯ сора-2
Серия GPT-5	`gpt-5`, , `gpt-5-mini`, `gpt-5-nanogpt-5-chat`предварительная версия
gpt-oss	Модели рассуждений с открытыми весами
codex-mini	Точно настроенная версия `o4-mini`.
Серия GPT-4.1	`gpt-4.1`, `gpt-4.1-mini`, `gpt-4.1-nano`
предварительный просмотр использования компьютера	Экспериментальная модель, обученная для использования инструмента работы с компьютером API Responses.
модели o-серии	Модели рассуждений с расширенным решением проблем и повышением фокуса и возможностей.
GPT-4o, GPT-4o mini и GPT-4 Turbo	Возможности моделей Azure OpenAI с многомодальными версиями, которые могут принимать как текст, так и изображения в качестве входных данных.
Внедрение	Набор моделей, которые могут преобразовать текст в числовую векторную форму для облегчения поиска схожести текстов.
Создание образа	Серия моделей, которые могут создавать исходные изображения на естественном языке.
`Video generation`	Модель, которая может создавать исходные видео-сцены из текстовых инструкций.
Аудио	Серия моделей для преобразования речи в текст, перевод и текст в речь. Звуковые модели GPT-4o поддерживают либо диалоговые взаимодействия с использованием как входящей, так и исходящей речи с низкой задержкой, либо создание аудио.

новый чат GPT

Сведения о доступности модели во всех регионах, сгруппированных по категории развертывания, см. в разделе Регион доступности для моделей Foundry, проданных Azure.

Возможности

Идентификатор модели	Описание	Окно контекста	Максимальное количество выходных маркеров	Учебные данные (до определенного объема)
`gpt-chat-latest` (2026-05-05) Предварительный просмотр	- Рассуждения — API завершения чата. - API ответов. — структурированные выходные данные — Функции, инструменты и параллельные вызовы инструментов.	128,000 Входные данные: 111 616 Выходные данные: 16,384	16,384	Август 2025 г.

Примечание

Вы также можете увидеть эту модель, называемую OpenAI как GPT-5.5 Instant или в API OpenAI как chat-latest. В Microsoft Foundry мы представляем gpt-chat-latest в качестве имени продукта для этого выпуска. Модель продолжает следовать существующему жизненному циклу предварительной версии и стандартным периодам уведомления. Мы также оцениваем способы упрощения доступа клиентов к постоянно обновляемым моделям с течением времени, но текущее поведение остается неизменным, так как эта работа продолжается.

GPT-5.5

Возможности

Идентификатор модели	Описание	Окно контекста	Максимальное количество выходных маркеров	Учебные данные (до определенного объема)
`gpt-5.5` (2026-04-24)	- Рассуждения - API ответов. — API завершения чата. — структурированные выходные данные. — Обработка текста и изображения. — Функции, инструменты и параллельные вызовы инструментов. - Использование компьютера - Полная сводка возможностей.	1050 000 br> Входные данные: 922 000 Выходные данные: 128 000	128,000	Декабрь 2025 г.

Примечание

Для развертывания этой модели для некоторых уровней квот потребуется запрашивать квоты gpt-5.5 . По умолчанию подписки уровня 5 и 6 имеют квоту.

GPT-5.4

Возможности

Идентификатор модели	Описание	Окно контекста	Максимальное количество выходных маркеров	Учебные данные (до определенного объема)
`gpt-5.4` (2026-03-05)	- Рассуждения - API ответов. — API завершения чата. — структурированные выходные данные. — Обработка текста и изображения. — Функции, инструменты и параллельные вызовы инструментов. - Использование компьютера - Полная сводка возможностей.	1,050,000	128,000	Август 2025 г.
`gpt-5.4-pro` (2026-03-05)	- Рассуждения - API ответов. — Обработка текста и изображения. — Функции и инструменты - Полная сводка возможностей.	1,050,000	128,000	Август 2025 г.
`gpt-5.4-mini` (2026-03-17)	- Рассуждения - API ответов. — API завершения чата. — структурированные выходные данные. — Обработка текста и изображения. — Функции, инструменты и параллельные вызовы инструментов. - Использование компьютера - Полная сводка возможностей.	400,000 Входные данные: 272 000 Выходные данные: 128 000	128,000	Август 2025 г.
`gpt-5.4-nano` (2026-03-17)	- Рассуждения - API ответов. — API завершения чата. — структурированные выходные данные. — Обработка текста и изображения. — Функции, инструменты и параллельные вызовы инструментов. - Полная сводка возможностей.	400,000 Входные данные: 272 000 Выходные данные: 128 000	128,000	Август 2025 г.

GPT-5.3

Возможности

Идентификатор модели	Описание	Окно контекста	Максимальное количество выходных маркеров	Учебные данные (до определенного объема)
`gpt-5.3-codex` (2026-02-24)	- Рассуждения - API ответов. — структурированные выходные данные. — Обработка текста и изображения. — Функции, инструменты и параллельные вызовы инструментов. - Полная сводка возможностей. — Оптимизировано для расширения Codex CLI и Codex VS Code	400,000 Входные данные: 272 000 Выходные данные: 128 000	128,000	Август 2025 г.
`gpt-5.3-chat` (2026-03-03) Предварительный просмотр	— API завершения чата. - API ответов. — структурированные выходные данные — Функции, инструменты и параллельные вызовы инструментов.	128,000 Входные данные: 111 616 Выходные данные: 16,384	16,384	Август 2025 г.

GPT-5.2

Возможности

Идентификатор модели	Описание	Окно контекста	Максимальное количество выходных маркеров	Учебные данные (до определенного объема)
`gpt-5.2-codex` (2026-01-14)	- Рассуждения - API ответов. — структурированные выходные данные. — Обработка текста и изображения. — Функции, инструменты и параллельные вызовы инструментов. - Полная сводка возможностей. — Оптимизировано для расширения Codex CLI и Codex VS Code	400,000 Входные данные: 272 000 Выходные данные: 128 000	128,000
`gpt-5.2` (2025-12-11)	- Рассуждения — API завершения чата. - API ответов. — структурированные выходные данные. — Обработка текста и изображения. — Функции, инструменты и параллельные вызовы инструментов. - Полная сводка возможностей.	400,000 Входные данные: 272 000 Выходные данные: 128 000	128,000	Август 2025 г.
`gpt-5.2-chat` (2025-12-11) Предварительный просмотр	— API завершения чата. - API ответов. — структурированные выходные данные — Функции, инструменты и параллельные вызовы инструментов.	128,000 Входные данные: 111 616 Выходные данные: 16,384	16,384	Август 2025 г.
`gpt-5.2-chat` (2026-02-10) Предварительный просмотр	— API завершения чата. - API ответов. — структурированные выходные данные — Функции, инструменты и параллельные вызовы инструментов.	128,000 Входные данные: 111 616 Выходные данные: 16,384	16,384	Август 2025 г.

Осторожно

Мы не рекомендуем использовать предварительные версии моделей в рабочей среде. Мы обновим все развертывания моделей предварительного просмотра до будущих версий предварительного просмотра или до последней стабильной общедоступной версии. Модели, назначенные предварительной версией, не соответствуют стандартному жизненному циклу модели OpenAI Azure.

GPT-5.1

Возможности

Идентификатор модели	Описание	Окно контекста	Максимальное количество выходных маркеров	Учебные данные (до определенного объема)
`gpt-5.1` (2025-11-13)	- Рассуждения — API завершения чата. - API ответов. — структурированные выходные данные. — Обработка текста и изображения. — Функции, инструменты и параллельные вызовы инструментов. - Полная сводка возможностей.	400,000 Входные данные: 272 000 Выходные данные: 128 000	128,000	30 сентября 2024 г.
`gpt-5.1-chat` (2025-11-13) Предварительный просмотр	- Рассуждения — API завершения чата. - API ответов. — структурированные выходные данные — Функции, инструменты и параллельные вызовы инструментов.	128,000 Входные данные: 111 616 Выходные данные: 16,384	16,384	30 сентября 2024 г.
`gpt-5.1-codex` (2025-11-13)	- Только API ответов . — Обработка текста и изображений — структурированные выходные данные. — Функции, инструменты и параллельные вызовы инструментов. - Полная сводка возможностей — Оптимизировано для расширения Codex CLI и Codex VS Code	400,000 Входные данные: 272 000 Выходные данные: 128 000	128,000	30 сентября 2024 г.
`gpt-5.1-codex-mini` (2025-11-13)	- Только API ответов . — Обработка текста и изображений — структурированные выходные данные. — Функции, инструменты и параллельные вызовы инструментов. - Полная сводка возможностей — Оптимизировано для расширения Codex CLI и Codex VS Code	400,000 Входные данные: 272 000 Выходные данные: 128 000	128,000	30 сентября 2024 г.
`gpt-5.1-codex-max` (2025-12-04)	- Только API ответов . — Обработка текста и изображений — структурированные выходные данные. — Функции, инструменты и параллельные вызовы инструментов. - Полная сводка возможностей — Оптимизировано для расширения Codex CLI и Codex VS Code	400,000 Входные данные: 272 000 Выходные данные: 128 000	128,000	30 сентября 2024 г.

Осторожно

Важно

gpt-5.1 reasoning_effort значение по умолчанию none. При обновлении предыдущих моделей gpt-5.1 логики следует помнить, что может потребоваться обновить код, чтобы явно передать reasoning_effort уровень, если требуется задействовать логику.
gpt-5.1-chat добавляет встроенные возможности рассуждений. Как и другие модели причин , они не поддерживают такие параметры temperature. При обновлении использования gpt-5-chat (которая не является моделью рассуждений) на gpt-5.1-chat, убедитесь, что удаляете любые пользовательские параметры, такие как temperature, из кода, которые не поддерживаются моделями рассуждений.
gpt-5.1-codex-max добавляет поддержку для настройки reasoning_effort на xhigh. Усилия по аргументации none не поддерживаются gpt-5.1-codex-max.

GPT-5

Возможности

Идентификатор модели	Описание	Окно контекста	Максимальное количество выходных маркеров	Учебные данные (до определенного объема)
`gpt-5` (2025-08-07)	- Рассуждения — API завершения чата. - API ответов. — структурированные выходные данные. — Обработка текста и изображения. — Функции, инструменты и параллельные вызовы инструментов. - Полная сводка возможностей.	400,000 Входные данные: 272 000 Выходные данные: 128 000	128,000	30 сентября 2024 г.
`gpt-5-mini` (2025-08-07)	- Рассуждения — API завершения чата. - API ответов. — структурированные выходные данные. — Обработка текста и изображения. — Функции, инструменты и параллельные вызовы инструментов. - Полная сводка возможностей.	400,000 Входные данные: 272 000 Выходные данные: 128 000	128,000	31 мая 2024 г.
`gpt-5-nano` (2025-08-07)	- Рассуждения — API завершения чата. - API ответов. — структурированные выходные данные. — Обработка текста и изображения. — Функции, инструменты и параллельные вызовы инструментов. - Полная сводка возможностей.	400,000 Входные данные: 272 000 Выходные данные: 128 000	128,000	31 мая 2024 г.
`gpt-5-chat` (2025-08-07) Предварительный просмотр	— API завершения чата. - API ответов. - Входные данные: текст и изображение - Выходные данные: только текст	128,000	16,384	30 сентября 2024 г.
`gpt-5-chat` (2025-10-03) Предварительная версия¹	— API завершения чата. - API ответов. - Входные данные: текст и изображение - Выходные данные: только текст	128,000	16,384	30 сентября 2024 г.
`gpt-5-codex` (2025-09-11)	- Только API ответов . - Входные данные: текст и изображение - Выходные данные: только текст — структурированные выходные данные. — Обработка текста и изображения. — Функции, инструменты и параллельные вызовы инструментов. - Полная сводка возможностей — Оптимизировано для расширения Codex CLI и Codex VS Code	400,000 Входные данные: 272 000 Выходные данные: 128 000	128,000	-
`gpt-5-pro` (2025-10-06)	- Рассуждения - API ответов. — структурированные выходные данные. — Обработка текста и изображения. — Функции и инструменты - Полная сводка возможностей.	400,000 Входные данные: 272 000 Выходные данные: 128 000	128,000	30 сентября 2024 г.

Примечание

¹gpt-5-chat версия 2025-10-03 представляет значительное улучшение, ориентированное на эмоциональный интеллект и возможности психического здоровья. Это обновление интегрирует специализированные наборы данных и усовершенствованные стратегии реагирования для улучшения способности модели:

Узнайте и интерпретируйте эмоциональный контекст более точно, что позволяет осуществлять более нюансированные и эмпатичные взаимодействия.
Предоставление поддерживающих и ответственных ответов в беседах, связанных с психическим здоровьем, с учетом чувствительности и соблюдения лучших практик.

Эти улучшения направлены на то, чтобы сделать GPT-5-чат более осведомленным о контексте, ориентированным на человека и надежным в ситуациях, где критически важны эмоциональный настрой и благополучие.

Осторожно

gpt-oss

Возможности

Идентификатор модели	Описание	Окно контекста	Максимальное количество выходных маркеров	Учебные данные (до определенного объема)
`gpt-oss-120b` ¹ (предварительная версия)	— только ввод/вывод текста — API завершения чата - Потоковая передача — Вызов функции — структурированные выходные данные -Рассуждения — доступно для развертывания¹ и с помощью управляемых вычислений	131,072	131,072	31 мая 2024 г.
`gpt-oss-20b` (предварительная версия)	— только ввод/вывод текста — API завершения чата - Потоковая передача — Вызов функции — структурированные выходные данные -Рассуждения — доступно с помощью управляемых вычислительных ресурсов и Foundry Local	131,072	131,072	31 мая 2024 г.

¹ В отличие от других моделей OpenAI Azure gpt-oss-120b требуется проект Foundry для развертывания модели.

Развертывание с помощью кода

az cognitiveservices account deployment create \
  --name "Foundry-project-resource" \
  --resource-group "test-rg" \
  --deployment-name "gpt-oss-120b" \
  --model-name "gpt-oss-120b" \
  --model-version "1" \
  --model-format "OpenAI-OSS" \
  --sku-capacity 10 \
  --sku-name "GlobalStandard"

Серия GPT-4.1

Возможности

Идентификатор модели	Описание	Окно контекста	Максимальное количество выходных токенов	Обучающие данные (максимум)
`gpt-4.1` (2025-04-14)	— ввод текста и изображения — вывод текста — API завершения чата — API ответов - Потоковая передача — Вызов функции — структурированные выходные данные (завершение чата)	- 1,047,576 — 300 000 (стандартные и подготовленные управляемые развертывания) - 128 000 (пакетные развертывания)	32,768	31 мая 2024 г.
`gpt-4.1-nano` (2025-04-14)	— ввод текста и изображения — вывод текста — API завершения чата — API ответов - Потоковая передача — Вызов функции — структурированные выходные данные (завершение чата)	- 1,047,576 — 300 000 (стандартные и подготовленные управляемые развертывания) - 128 000 (пакетные развертывания)	32,768	31 мая 2024 г.
`gpt-4.1-mini` (2025-04-14)	— ввод текста и изображения — вывод текста — API завершения чата — API ответов - Потоковая передача — Вызов функции — структурированные выходные данные (завершение чата)	- 1,047,576 — 300 000 (стандартные и подготовленные управляемые развертывания) - 128 000 (пакетные развертывания)	32,768	31 мая 2024 г.

Известная проблема

Известная проблема влияет на все модели серии GPT 4.1. Определения вызовов инструментов или функций большого размера, которые превышают 300 000 токенов, приводят к сбоям, даже если не достигнут предел контекста в 1 миллион токенов моделей.

Ошибки могут отличаться на основе вызовов API и базовых характеристик полезных данных.

Ниже приведены сообщения об ошибках ДЛЯ API завершения чата:

Error code: 400 - {'error': {'message': "This model's maximum context length is 300000 tokens. However, your messages resulted in 350564 tokens (100 in the messages, 350464 in the functions). Please reduce the length of the messages or functions.", 'type': 'invalid_request_error', 'param': 'messages', 'code': 'context_length_exceeded'}}
Error code: 400 - {'error': {'message': "Invalid 'tools[0].function.description': string too long. Expected a string with maximum length 1048576, but got a string with length 2778531 instead.", 'type': 'invalid_request_error', 'param': 'tools[0].function.description', 'code': 'string_above_max_length'}}

Ниже приведено сообщение об ошибке ДЛЯ API ответов:

Error code: 500 - {'error': {'message': 'The server had an error processing your request. Sorry about that! You can retry your request, or contact us through an Azure support request at: https://go.microsoft.com/fwlink/?linkid=2213926 if you keep seeing this error. (Please include the request ID d2008353-291d-428f-adc1-defb5d9fb109 in your email.)', 'type': 'server_error', 'param': None, 'code': None}}

компьютерная предварительная версия

Экспериментальная модель, обученная для использования с инструментом API ответов в вычислительных системах.

Его можно использовать с сторонними библиотеками, чтобы позволить модели управлять вводом мыши и клавиатуры, а также получать контекст из снимков экрана текущей среды.

Осторожно

Для доступа computer-use-previewтребуется регистрация. Доступ предоставляется на основе критериев соответствия Microsoft. Клиенты, имеющие доступ к другим моделям ограниченного доступа, по-прежнему должны запрашивать доступ к этой модели.

Чтобы запросить доступ, перейдите к приложениюcomputer-use-preview модели ограниченного доступа. После предоставления доступа необходимо создать развертывание для модели.

Возможности

Идентификатор модели	Описание	Окно контекста	Максимальное количество выходных токенов	Обучающие данные (максимум)
`computer-use-preview` (2025-03-11)	Специализированная модель для использования с инструментом для работы с компьютером Responses API -Инструменты - Стриминг — Текст (входные и выходные данные) — изображение (входные данные)	8,192	1,024	Октябрь 2023 г.

модели o-серии

Модели Azure OpenAI o-серии разработаны для решения задач рассуждения и решения проблем с повышенным вниманием и возможностями. Эти модели тратят больше времени на обработку и понимание запроса пользователя, что делает их исключительно сильными в таких областях, как наука, программирование и математика, по сравнению с предыдущими итерациями.

Возможности

Идентификатор модели	Описание	Максимальное количество токенов в запросе	Обучающие данные (максимум)
`codex-mini` (2025-05-16)	Точно настроенная версия `o4-mini`. - API ответов. — структурированные выходные данные. — Обработка текста и изображения. — Функции и инструменты. Полная сводка возможностей.	Входные данные: 200 000 Выходные данные: 100 000	31 мая 2024 г.
`o3-pro` (2025-06-10)	- API ответов. — структурированные выходные данные. — Обработка текста и изображения. — Функции и инструменты. Полная сводка возможностей.	Входные данные: 200 000 Выходные данные: 100 000	31 мая 2024 г.
`o4-mini` (2025-04-16)	- Новая модель рассуждений, предлагающая расширенные возможности аргументирования. — API завершения чата. - API ответов. — структурированные выходные данные. — Обработка текста и изображения. — Функции и инструменты. Полная сводка возможностей.	Входные данные: 200 000 Выходные данные: 100 000	31 мая 2024 г.
`o3` (2025-04-16)	- Новая модель рассуждений, предлагающая расширенные возможности аргументирования. — API завершения чата. - API ответов. — структурированные выходные данные. — Обработка текста и изображения. — Функции, инструменты и параллельные вызовы инструментов. Полная сводка возможностей.	Входные данные: 200 000 Выходные данные: 100 000	31 мая 2024 г.
`o3-mini` (2025-01-31)	- Расширенные способности рассудка. — структурированные выходные данные. Только текстовая обработка. — Функции и инструменты.	Входные данные: 200 000 Выходные данные: 100 000	Октябрь 2023 г.
`o1` (2024-12-17)	- Расширенные способности рассудка. — структурированные выходные данные. — Обработка текста и изображения. — Функции и инструменты.	Входные данные: 200 000 Выходные данные: 100 000	Октябрь 2023 г.
`o1-preview` ¹ (2024-09-12)	Более ранняя предварительная версия.	Входные данные: 128 000 Выходные данные: 32 768	Октябрь 2023 г.
`o1-mini` ² (2024-09-12)	Более быстрый и более экономичный вариант в серии o1 идеально подходит для задач программирования, требующих скорости и снижения потребления ресурсов. — Глобальное развертывание уровня "Стандартный", доступное по умолчанию. — Развертывания уровня "Стандартный" (региональные) в настоящее время доступны только для тех клиентов, которые получили доступ в рамках выпуска ограниченного `o1-preview` доступа.	Входные данные: 128 000 Выходные данные: 65 536	Октябрь 2023 г.

¹o1-preview доступна только для клиентов, которым предоставлен доступ в рамках исходного ограниченного доступа.

²o1-mini в настоящее время доступно всем клиентам для развертывания Global Standard. Некоторые клиенты получили стандартный (региональный) доступ к развертыванию o1-mini в рамках ограниченного выпуска o1-preview доступа. В настоящее время доступ к стандартным o1-mini (региональным) развертываниям не расширяется.

В настоящее время o3-deep-research доступен только через службу агента Foundry. Дополнительные сведения см. в руководстве по глубокому исследованию.

Дополнительные сведения о расширенных моделях серии o см. в статье "Начало работы с моделями причин".

GPT-4o и GPT-4 Turbo

GPT-4o интегрирует текст и изображения в одну модель, что позволяет одновременно обрабатывать несколько типов данных. Этот многомодальный подход повышает точность и скорость реагирования на взаимодействие с компьютером. GPT-4o соответствует GPT-4 Turbo в задачах английского текста и программирования, обеспечивая более высокую производительность в задачах, отличных от английского языка, и задачах визуального зрения, устанавливая новые тесты для возможностей искусственного интеллекта.

Модели GPT-4 и GPT-4 Turbo

Эти модели можно использовать только с API завершения чата. См. версии моделей, чтобы узнать, как Azure OpenAI обрабатывает обновления версий моделей. Ознакомьтесь с моделями, чтобы узнать, как просматривать и настраивать параметры версии модели для развертываний GPT-4.

Возможности

Идентификатор модели	Описание	Максимальное количество токенов в запросе	Обучающие данные (максимум)
`gpt-4o` (2024-11-20) GPT-4o (Omni)	— структурированные выходные данные. — Обработка текста и изображения. — режим JSON. — параллельный вызов функции. — улучшенная точность и скорость реагирования. — Паритетность с английским текстом и задачами программирования по сравнению с GPT-4 Turbo с Vision. — высокая производительность на языках, отличных от английского языка, и в задачах визуального зрения. - Улучшенные творческие способности писать.	Входные данные: 128 000 Выходные данные: 16,384	Октябрь 2023 г.
`gpt-4o` (2024-08-06) GPT-4o (Omni)	— структурированные выходные данные. — Обработка текста и изображения. — режим JSON. — параллельный вызов функции. — улучшенная точность и скорость реагирования. — Паритетность с английским текстом и задачами программирования по сравнению с GPT-4 Turbo с Vision. — высокая производительность на языках, отличных от английского языка, и в задачах визуального зрения.	Входные данные: 128 000 Выходные данные: 16,384	Октябрь 2023 г.
`gpt-4o-mini` (2024-07-18) GPT-4o mini	— Быстрая, недорогая и мощная модель идеально подходит для замены моделей серии GPT-3.5 Turbo. — Обработка текста и изображения. — режим JSON. — параллельный вызов функции.	Входные данные: 128 000 Выходные данные: 16,384	Октябрь 2023 г.
`gpt-4o` (2024-05-13) GPT-4o (Omni)	— Обработка текста и изображения. — режим JSON. — параллельный вызов функции. — улучшенная точность и скорость реагирования. — Паритетность с английским текстом и задачами программирования по сравнению с GPT-4 Turbo с Vision. — высокая производительность на языках, отличных от английского языка, и в задачах визуального зрения.	Входные данные: 128 000 Вывод: 4 096	Октябрь 2023 г.
`gpt-4` ¹ (turbo-2024-04-09) GPT-4 Turbo с функцией зрения	Новая общедоступная модель. — замена всех предыдущих предварительных моделей GPT-4 (`vision-preview`, `1106-Preview`, `0125-Preview`). - Доступность компонентов в настоящее время отличается в зависимости от метода ввода и типа развертывания.	Входные данные: 128 000 Вывод: 4 096	Декабрь 2023 г.

¹ Подготовленная версия версии gpt-4turbo-2024-04-09 в настоящее время ограничена только текстом. Дополнительные сведения о подготовленных развертываниях см. в руководстве по подготовке.

Осторожно

Встраивания

text-embedding-3-large является последней и самой способной моделью внедрения. Невозможно обновиться между моделями встраивания. Чтобы перейти с использования text-embedding-ada-002 на использование text-embedding-3-large, необходимо создать новые эмбеддинги.

text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002

Возможности

OpenAI сообщает, что тесты показывают, что модели эмбеддингов большого и малого третьего поколения обеспечивают лучшую среднюю производительность многоязычного извлечения с использованием бенчмарка MIRACL. Они по-прежнему поддерживают производительность для задач на английском языке с использованием теста MTEB.

Эталон оценки	`text-embedding-ada-002`	`text-embedding-3-small`	`text-embedding-3-large`
Среднее значение MIRACL	31.4	44.0	54.9
Среднее значение MTEB	61.0	62.3	64.6

Модели внедрения третьего поколения поддерживают уменьшение размера внедрения с помощью нового dimensions параметра. Как правило, более крупные внедрения являются более дорогими с точки зрения вычислений, памяти и хранилища. При настройке количества измерений вы получаете больше контроля над общими затратами и производительностью. Параметр dimensions не поддерживается во всех версиях библиотеки openAI 1.x Python. Чтобы воспользоваться этим параметром, рекомендуется обновить до последней версии: pip install openai --upgrade

Тестирование по MTEB в OpenAI показало, что даже если размерности модели третьего поколения text-embeddings-ada-002 уменьшены до менее чем 1536, производительность остается немного лучше.

Эти модели можно использовать только с запросами API внедрения.

Идентификатор модели	Максимальное количество токенов в запросе	Измерения выходных данных	Обучающие данные (максимум)
`text-embedding-ada-002` (версия 2)	8,192	1,536	Сентябрь 2021 г.
`text-embedding-ada-002` (версия 1)	2,046	1,536	Сентябрь 2021 г.
`text-embedding-3-large`	8,192	3,072	Сентябрь 2021 г.
`text-embedding-3-small`	8,192	1,536	Сентябрь 2021 г.

Примечание

При отправке массива входных данных для внедрения максимальное количество входных элементов в массиве на вызов конечной точки внедрения составляет 2048.

Модели создания изображений

Модели создания изображений создают изображения из текстовых запросов, которые предоставляет пользователь. Модели создания изображений включают gpt-image-1, и gpt-image-1-minigpt-image-1.5gpt-image-2.

Идентификатор модели	Максимальная длина запроса (символы)
`gpt-image-1`	4,000
`gpt-image-1-mini`	4,000
`gpt-image-1.5`	4,000

Модели создания видео

Sora — это модель ИИ из OpenAI, которая может создавать реалистичные и образные видео сцены из текстовых инструкций. Sora находится в предварительной версии.

Модели создания видео включают sora и sora-2.

Идентификатор модели	Максимальный запрос (символы)
Сора	4,000

Звуковые модели

Звуковые модели в Azure OpenAI доступны через API realtime, completions и audio.

Аудиомодели GPT-4o

Звуковые модели GPT-4o являются частью семейства моделей GPT-4o и поддерживают либо взаимодействия с низкой задержкой речь в, речь из, либо аудиогенерацию.

Осторожно

Сведения о максимальных маркерах запроса и обучающих данных доступны в следующей таблице:

Идентификатор модели	Описание	Максимальное количество токенов в запросе	Обучающие данные (максимум)
`gpt-4o-mini-audio-preview` (2024-12-17) Предварительный просмотр	Звуковая модель для создания звука и текста.	Входные данные: 128 000 Выходные данные: 16,384	Сентябрь 2023 г.
`gpt-4o-audio-preview` (2024-12-17)	Звуковая модель для создания звука и текста.	Входные данные: 128 000 Выходные данные: 16,384	Сентябрь 2023 г.
`gpt-4o-realtime-preview` (2025-06-03)	Звуковая модель для обработки звука в режиме реального времени.	Входные данные: 32 000 Вывод: 4 096	Октябрь 2023 г.
`gpt-4o-realtime-preview` (2024-12-17)	Звуковая модель для обработки звука в режиме реального времени.	Вход: 16 000 Вывод: 4 096	Октябрь 2023 г.
`gpt-4o-mini-realtime-preview` (2024-12-17) Предварительный просмотр	Звуковая модель для обработки звука в режиме реального времени.	Входные данные: 128 000 Вывод: 4 096	Октябрь 2023 г.
`gpt-audio`(28.08.2025) `gpt-audio-mini`(06.10.2025)	Звуковая модель для создания звука и текста.	Входные данные: 128 00 Выходные данные: 16,384	Октябрь 2023 г.
`gpt-realtime` (2025-08-28) (GA) `gpt-realtime-mini` (2025-10-06) `gpt-realtime-mini` (2025-12-15)	Звуковая модель для обработки звука в режиме реального времени.	Входные данные: 32,00 Вывод: 4 096	Октябрь 2023 г.
`gpt-audio-1.5` (2026-02-23)	Звуковая модель для создания звука и текста.	Входные данные: 128 00 Выходные данные: 16,384	Сентябрь 2024 г.
`gpt-realtime-1.5` (2026-02-23)	Звуковая модель для обработки звука в режиме реального времени.	Входные данные: 32,00 Вывод: 4 096	Сентябрь 2024 г.

API аудио

Звуковые модели с помощью /audio API можно использовать для преобразования речи в текст, перевод и текст в речь.

Модели преобразования речи в текст

Идентификатор модели	Описание	Максимальный запрос (размер аудиофайла)
`whisper`	Модель распознавания речи общего назначения.	25 МБ
`gpt-4o-transcribe` (2025-03-20) Предварительный просмотр	Модель преобразования речи в текст на основе GPT-4o.	25 МБ
`gpt-4o-mini-transcribe` (2025-03-20) Предварительный просмотр	Модель преобразования речи в текст с помощью GPT-4o mini.	25 МБ
`gpt-4o-transcribe-diarize` (2025-10-15) Предварительный просмотр	Модель преобразования речи в текст с автоматическим распознаванием речи.	25 МБ
`gpt-4o-mini-transcribe` (2025-12-15) Предварительный просмотр	Модель преобразования речи в текст с автоматическим распознаванием речи. Улучшена точность транскрибирования и надежность.	25 МБ

Модели перевода речи

Идентификатор модели	Описание	Максимальный запрос (размер аудиофайла)
`whisper`	Модель распознавания речи общего назначения.	25 МБ

Модели преобразования текста в речь (предварительная версия)

Идентификатор модели	Описание
`tts` Предварительный просмотр	Модель преобразования текста в речь, оптимизированная для скорости.
`tts-hd` Предварительный просмотр	Модель преобразования текста в речь, оптимизированная для качества.
`gpt-4o-mini-tts` (2025-03-20)	Модель преобразования текста в речь с помощью GPT-4o mini. Вы можете управлять голосом, чтобы говорить в определенном стиле или тоне.
`gpt-4o-mini-tts` (2025-12-15)	Модель преобразования текста в речь с помощью GPT-4o mini. Вы можете управлять голосом, чтобы говорить в определенном стиле или тоне.

Модели для тонкой настройки

Для точной настройки поддерживаются следующие модели:

Идентификатор модели	Стандартные регионы	Глобальный	Разработчик	Методы	Статус	Модальности
`gpt-4o-mini` (2024-07-18)	Северная часть США Центральная Швеция	✅	✅	SFT	GA	Текст в текст
`gpt-4o` (2024-08-06)	Восточная часть США2 Северная часть США Центральная Швеция	✅	✅	SFT, DPO	GA	Текст и распознавание текста из изображений
`gpt-4.1` (2025-04-14)	Северная часть США Центральная Швеция	✅	✅	SFT, DPO	GA	Текст и распознавание текста из изображений
`gpt-4.1-mini` (2025-04-14)	Северная часть США Центральная Швеция	✅	✅	SFT, DPO	GA	Текст в текст
`gpt-4.1-nano` (2025-04-14)	Северная часть США Центральная Швеция	✅	✅	SFT, DPO	GA	Текст в текст
`o4-mini` (2025-04-16)	Восточная часть США2 Центральная Швеция	✅	❌	RFT	GA	Текст в текст
`gpt-5` (2025-08-07)	Северная часть США Центральная Швеция	✅	✅	RFT	Частная предварительная версия	Текст в текст
`Ministral-3B` (2411)	Не поддерживается	✅	❌	SFT	Общедоступная предварительная версия	Текст в текст
`Qwen-32B`	Не поддерживается	✅	❌	SFT	Общедоступная предварительная версия	Текст в текст
`Llama-3.3-70B-Instruct`	Не поддерживается	✅	❌	SFT	Общедоступная предварительная версия	Текст в текст
`gpt-oss-20b`	Не поддерживается	✅	❌	SFT	Общедоступная предварительная версия	Текст в текст

Или можно доработать ранее настроенную модель, отформатированную как base-model.ft-{jobid}.

Примечание

Модели с открытым кодом (Ministral-3B, Qwen-32B, Llama-3.3-70B-Instruct, gpt-oss-20b) поддерживаются только в ресурсах Foundry и в новом пользовательском интерфейсе Foundry.

Примечание

Глобальное обучение обеспечивает более доступное обучение за токен, но не предусматривает размещение данных. В настоящее время он доступен для ресурсов Foundry в следующих регионах:

Восточная Австралия
Южная Бразилия
Центральная Канада
Восточная Канада
Восточная часть США
Восточная часть США2
Центральная Франция
Центрально-западная Германия
Италия Север
Восточная Япония (нет поддержки зрения)
Центральная Корея
Северная часть США
Восточная Норвегия
Центральная Польша (поддержка 4.1-nano отсутствует)
Юго-Восточная Азия
Юг Африки Север
Южная часть США
Южная Индия
Центральная Испания
Центральная Швеция
Западная Швейцария
Северная Швейцария
Южная Часть Великобритании
Западная Европа
Западная часть США
Западная часть США3

Помощники (предварительная версия)

Для помощников требуется сочетание поддерживаемой модели и поддерживаемого региона. Для некоторых инструментов и возможностей требуются последние модели. Следующие модели доступны в API Помощников, пакете SDK и Foundry. Таблица ниже предназначена для стандартного развертывания. Сведения о доступности подготовленной единицы пропускной способности см. в разделе "Подготовленные модели пропускной способности". Перечисленные модели и регионы можно использовать как с помощниками версии 1, так и с версией 2. Вы можете использовать модели Global Standard, если они поддерживаются в следующих регионах.

Регион	gpt-4o, 2024-05-13	gpt-4o, 2024-08-06	gpt-4o-mini, 2024-07-18	gpt-4, 0613	gpt-4, 1106-Предварительный просмотр	gpt-4, 0125-Предварительная версия	gpt-4, turbo-2024-04-09	gpt-4-32k, 0613	gpt-35-turbo, 0613	gpt-35-turbo, 1106	gpt-35-turbo, 0125	gpt-35-turbo-16k, 0613
австралия восток	-	-	-	✅	✅	-	-	✅	✅	✅	✅	✅
eastus	✅	✅	✅	-	-	✅	✅	-	✅	-	✅	✅
eastus2	✅	✅	✅	-	✅	-	✅	-	✅	-	✅	✅
francecentral	-	-	-	✅	✅	-	-	✅	✅	✅	-	✅
japaneast	-	-	-	-	-	-	-	-	✅	-	✅	✅
Норвегия восток	-	-	-	-	✅	-	-	-	-	-	-	-
Южная Индия	-	-	-	-	✅	-	-	-	-	✅	✅	-
Швецияcentral	✅	✅	✅	✅	✅	-	✅	✅	✅	✅	-	✅
uksouth	-	-	-	-	✅	✅	-	-	✅	✅	✅	✅
westus	✅	✅	✅	-	✅	-	✅	-	-	✅	✅	-
westus3	✅	✅	✅	-	✅	-	✅	-	-	-	✅	-

Вывод модели из эксплуатации

Последние сведения о выходе на пенсию модели см. в расписании выхода на пенсию модели.

Модели Black Forest Labs, проданные Azure

Модели FLUX от Black Forest Labs (BFL) предоставляют современные технологии генерации изображений в Microsoft Foundry, позволяя вам создавать и редактировать высококачественные изображения, используя текстовые подсказки и референсные изображения. Модели FLUX поддерживают ряд возможностей, включая генерацию изображений из текста, редактирование изображений с использованием нескольких ссылок, а также генерацию и редактирование в контексте.

Эти модели можно запускать с помощью API поставщика услуг BFL, а также через конечные точки images/generations и images/edits.

Чтобы работать с моделями FLUX в Foundry, см. Развертывание и использование моделей FLUX в Microsoft Foundry.

Регистрация необходима для доступа к FLUX.2 [flex] (предварительная версия).

Модель	Тип и конечная точка API	Возможности	Тип развертывания (доступность региона)
`FLUX.2-flex` Предварительный просмотр	Создание образа - API поставщика услуг BFL: `<resource-name>/providers/blackforestlabs/v1/flux-2-flex`	- Входные данные: текст и изображение (32 000 маркеров и до 10 изображенийⁱ) - Выход: Один образ - Вызов инструмента: Нет - Форматы ответов: Изображение (PNG и JPG) - Ключевые функции: Точное управление; Поддержка нескольких ссылок для до 10 образов - Дополнительные параметры: `guidance`: определяет, насколько тесно выходные данные соответствуют запросу. Минимум: 1.5, максимум: 10, по умолчанию: 4.5. Выше = более тесное соблюдение запроса. `steps`: количество шагов вывода. Максимум: 50, по умолчанию: 50. Выше означает больше деталей, но медленнее.	— глобальный стандарт (все регионы)
`FLUX.2-pro` Предварительный просмотр	Создание образа - API поставщика услуг BFL: `<resource-name>/providers/blackforestlabs/v1/flux-2-pro`	- Входные данные: текст и изображение (32 000 маркеров и до 8 изображенийⁱⁱ) - Выход: Один образ - Вызов инструмента: Нет - Форматы ответов: Изображение (PNG и JPG) - Ключевые функции: Поддержка нескольких ссылок для до 8 изображений; более приближенный к реальным знаниям; большая гибкость выходных данных; улучшенная производительность - Дополнительные параметры:(Только ДЛЯ API для конкретного поставщика) Поддерживает все параметры.	— глобальный стандарт (все регионы)
`FLUX.1-Kontext-pro` Предварительный просмотр	Создание образа - API изображений: `https://<resource-name>/openai/deployments/{deployment-id}/images/generations` И `https://<resource-name>/openai/deployments/{deployment-id}/images/edits` - API поставщика услуг BFL: `<resource-name>/providers/blackforestlabs/v1/flux-kontext-pro?api-version=preview`	- Входные данные: текст и изображение (5000 маркеров и 1 изображение) - Выход: Один образ - Вызов инструмента: Нет - Форматы ответов: Изображение (PNG и JPG) - Ключевые функции: Согласованность символов, расширенное редактирование - Дополнительные параметры:(Только api для конкретного поставщика)`seed`, `aspect ratio`, , `input_image`, `prompt_unsampling`, `safety_toleranceoutput_format`	— глобальный стандарт (все регионы)
`FLUX-1.1-pro` Предварительный просмотр	Создание образа - API изображений: `https://<resource-name>/openai/deployments/{deployment-id}/images/generations` - API поставщика услуг BFL: `<resource-name>/providers/blackforestlabs/v1/flux-pro-1.1?api-version=preview`	- Входные данные: текст (5000 маркеров и 1 изображение) - Выход: Один образ - Вызов инструмента: Нет - Форматы ответов: Изображение (PNG и JPG) - Ключевые функции: Быстрая скорость вывода, строгое соблюдение запросов, конкурентное ценообразование, масштабируемое поколение - Дополнительные параметры:(Только api для конкретного поставщика)`width`, `height`, , `prompt_unsampling`, `seed`, `safety_toleranceoutput_format`	— глобальный стандарт (все регионы)

^i,ii Поддержка нескольких эталонных образов доступна для FLUX.2 [pro] (предварительная версия) и FLUX.2 [flex] (предварительная версия) с помощью API, но не на игровой площадке.

модели Cohere, доступные в Azure

Семейство моделей Cohere включает различные модели, оптимизированные для различных вариантов использования, включая завершение чата, повторную классификацию и классификацию текста и внедрение. Модели Cohere оптимизированы для различных вариантов использования, включающих причины, сводку и ответы на вопросы.

Модель	Тип	Возможности	Тип развертывания (доступность региона)
`Cohere-rerank-v4.0-pro`	классификация текста (переупорядочение)	- Входные данные: текст - Выходные данные: текст - Языки:`en`, `fresitdept-brjazh-cnarvi`, , `hiruidnl` - Вызов инструмента: Нет - Форматы ответов: JSON	— глобальный стандарт (все регионы) — Управляемые вычисления
`Cohere-rerank-v4.0-fast`	классификация текста (переупорядочение)	- Входные данные: текст - Выходные данные: текст - Языки:`en`, `fresitdept-brjazh-cnarvi`, , `hiruidnl` - Вызов инструмента: Нет - Форматы ответов: JSON	— глобальный стандарт (все регионы) — Управляемые вычисления
`Cohere-command-a`	завершение чата	- Входные данные: текст (131 072 токенов) - Выходные данные: текст (8 182 токенов) - Языки:`en`, `fresitdept-brja`, и `kozh-cnar` - Вызов инструмента: Да - Форматы ответов: Текст, JSON	— глобальный стандарт (все регионы)
`embed-v-4-0`	эмбединги	- Входные данные: текст (512 токенов) и изображения (2MM пикселей) - Выход: Вектор (256, 512, 1024, 1536 dim.) - Языки:`en`, `fresitdept-brja`, и `kozh-cnar`	— глобальный стандарт (все регионы)

Модели DeepSeek, проданные Azure

Семейство моделей DeepSeek включает в себя несколько моделей рассуждения, которые выделяются в заданиях, требующих пошагового подхода, таких как языковые задачи, научное обоснование и программирование.

Модель	Тип	Возможности	Тип развертывания (доступность региона)
`DeepSeek-V4-Pro` Предварительный просмотр	завершение чата (с контентом аргументации)	- Входные данные: текст (1 000 000 токенов) - Выходные данные: текст (384 000 токенов) - Языки:`en` И `zh` - Вызов инструмента: Нет - Форматы ответов: Текст, JSON	— глобальный стандарт (все регионы)
`DeepSeek-V4-Flash` Предварительный просмотр	завершение чата (с контентом аргументации)	- Входные данные: текст (1 000 000 токенов) - Выходные данные: текст (384 000 токенов) - Языки:`en` И `zh` - Вызов инструмента: Нет - Форматы ответов: Текст, JSON	— глобальный стандарт (все регионы)
`DeepSeek-V3.2-Speciale` Предварительный просмотр	завершение чата (с контентом аргументации)	- Входные данные: текст (128 000 токенов) - Выходные данные: текст (128 000 маркеров) - Языки:`en` И `zh` - Вызов инструмента: Нет - Форматы ответов: Текст, JSON	— глобальный стандарт (все регионы)
`DeepSeek-V3.2` Предварительный просмотр	завершение чата (с контентом аргументации)	- Входные данные: текст (128 000 токенов) - Выходные данные: текст (128 000 маркеров) - Языки:`en` И `zh` - Вызов инструмента: Нет - Форматы ответов: Текст, JSON	— глобальный стандарт (все регионы)
`DeepSeek-V3.1` Предварительный просмотр	завершение чата (с контентом аргументации)	- Входные данные: текст (131 072 токенов) - Выходные данные: текст (131 072 токенов) - Языки:`en` И `zh` - Вызов инструмента: Да - Форматы ответов: Текст, JSON	— глобальный стандарт (все регионы)
`DeepSeek-R1-0528` Предварительный просмотр	завершение чата (с контентом аргументации)	- Входные данные: текст (163 840 токенов) - Выходные данные: текст (163 840 токенов) - Языки:`en` И `zh` - Вызов инструмента: Нет - Форматы ответов: Текст	— глобальный стандарт (все регионы) — глобально развернутые (все регионы)
`DeepSeek-V3-0324` Предварительный просмотр	завершение чата	- Входные данные: текст (131 072 токенов) - Выходные данные: текст (131 072 токенов) - Языки:`en` И `zh` - Вызов инструмента: Да - Форматы ответов: Текст, JSON	— глобальный стандарт (все регионы) — глобально развернутые (все регионы)
`DeepSeek-R1`	завершение чата (с контентом аргументации)	- Входные данные: текст (163 840 токенов) - Выходные данные: текст (163 840 токенов) - Языки:`en` И `zh` - Вызов инструмента: Нет - Форматы ответов: Текст	— глобальный стандарт (все регионы) — глобально развернутые (все регионы)

Метамодели, проданные Azure

Модели и инструменты Meta Llama — это коллекция предварительно обученных и тонко настроенных моделей генеративного ИИ для текстов и моделей логического вывода с изображениями. Диапазон метамоделей масштабируется, чтобы включать:

Небольшие языковые модели (SLM), такие как 1B и 3B Base и модели Instruct для инференса на устройствах и периферийных устройствах.
Модели языка среднего размера (LLMs), такие как 7B, 8B и 70B Base и Instruct models
Высокопроизводительные модели, такие как Meta Llama 3.1-405B, используются для создания синтетических данных и применения в сценариях дистилляции.

Модель	Тип	Возможности	Тип развертывания (доступность региона)
`Llama-4-Maverick-17B-128E-Instruct-FP8` Предварительный просмотр	завершение чата	- Входные данные: текст и изображения (маркеры 1M) - Выходные данные: текст (маркеры 1M) - Языки:`ar`, `enfrdehiiditptes`, и `tlthvi` - Вызов инструмента: Нет - Форматы ответов: Текст	— глобальный стандарт (все регионы)
`Llama-3.3-70B-Instruct` Предварительный просмотр	завершение чата	- Входные данные: текст (128 000 токенов) - Выходные данные: текст (8 192 токенов) - Языки:`en`, , `de`, `fritpt`, `hi`, и `esth` - Вызов инструмента: Нет - Форматы ответов: Текст	— глобальный стандарт (все регионы) — глобально развернутые (все регионы)

Некоторые метамодели также доступны от партнеров и сообщества.

Модели Microsoft, продаваемые через Azure

Модельный ряд Microsoft включает различные группы, такие как маршрутизатор моделей, модели MAI, модели Phi, модели для здравоохранения AI и другие. Также доступны несколько моделей Microsoft от партнеров и сообщества.

Сведения о работе с моделями преобразования текста в изображение MAI-Image-2e и MAI-Image-2 в Foundry см. в статье Развертывание и использование моделей MAI в Microsoft Foundry.

Модель	Тип	Возможности	Тип развертывания (доступность региона)
`MAI-Image-2e` Предварительный просмотр	Текст к изображению. Дополнительные сведения см. в конечной точке API .	- Входные данные: текст - Выход: Один образ - Длина контекста: 32 000 токенов - Вызов инструмента: Нет - Форматы ответов: Изображение (PNG) - Языки:`en` - Ключевые функции: Высококачественное создание текста в изображение; синтез фотореалистических изображений с согласованной визуальной структурой; хорошо подходит для изображений продуктов, маркетинговых визуальных элементов, активов бренда и коммерческих творческих рабочих процессов. - Параметры:`width`, , `heightprompt` Минимальное значение 768×768 пикселей; максимальное количество пикселей 1 048 576 (эквивалентно 1024×1024). Любое измерение может превышать 1024, пока общее число пикселей остается в пределах предела (например, 768×1365).	- Глобальный стандарт (западная часть США, восточная часть США, западная часть США, Западная Европа, Центральная Швеция, Южная Индия)
`MAI-Image-2` Предварительный просмотр	Текст к изображению. Дополнительные сведения см. в конечной точке API .	- Входные данные: текст - Выход: Один образ - Длина контекста: 32 000 токенов - Вызов инструмента: Нет - Форматы ответов: Изображение (PNG) - Языки:`en` - Ключевые функции: Высококачественное создание текста в изображение; синтез фотореалистических изображений с согласованной визуальной структурой; хорошо подходит для изображений продуктов, маркетинговых визуальных элементов, активов бренда и коммерческих творческих рабочих процессов. - Параметры:`width`, , `heightprompt` Минимальное значение 768×768 пикселей; максимальное количество пикселей 1 048 576 (эквивалентно 1024×1024). Любое измерение может превышать 1024, пока общее число пикселей остается в пределах предела (например, 768×1365).	- Глобальный стандарт (западная часть США, восточная часть США, западная часть США, Западная Европа, Центральная Швеция, Южная Индия)
`model-router` ¹	завершение чата	Дополнительные сведения см. в обзоре маршрутизатора модели. - Входные данные: текст, изображение - Выходные данные: текст (максимальное количество выходных токенов изменяется^{до 2}) Окно контекста: 200 000³ - Языки:`en`	- Глобальный стандарт (восточная часть США 2, Центральная Швеция) — Зона данных стандарта⁴ (восточная часть США 2, Центральная Швеция)

¹Версия модели маршрутизатора2025-11-18. Более ранние версии (2025-08-07 и 2025-05-19) также доступны.

²Максимальное значение выходных маркеров зависит от базовых моделей в маршрутизаторе модели. Например, 32 768 (), 100 000 (GPT-4.1 series), 128 000 (o4-minigpt-5 reasoning models) и 16 384 (gpt-5-chat).

³ Более крупные контекстные окна совместимы с некоторыми базовыми моделями маршрутизатора модели. Это означает, что вызов API с большим контекстом завершается успешно, только если запрос перенаправляется в одну из таких моделей. В противном случае вызов завершается ошибкой.

⁴ Выставление счетов за развертывание маршрутизаторов модели "Стандартный" для зоны данных начинается не раньше 1 ноября 2025 г.

Модели Mistral, продаваемые в Azure

Модель	Тип	Возможности	Тип развертывания (доступность региона)
`mistral-document-ai-2512`	Изображение к тексту	- Входные данные: изображения или PDF-страницы (30 страниц, максимум 30 МБ PDF-файла) - Выходные данные: текст - Языки:`en` - Вызов инструмента: нет - Форматы ответов: Текст, JSON, Markdown	— глобальный стандарт (все регионы) — стандарт зоны данных (США и ЕС)
`mistral-document-ai-2505` Предварительный просмотр	Изображение к тексту	- Входные данные: изображения или PDF-страницы (30 страниц, максимум 30 МБ PDF-файла) - Выходные данные: текст - Языки:`en` - Вызов инструмента: нет - Форматы ответов: Текст, JSON, Markdown	— глобальный стандарт (все регионы) — стандарт зоны данных (США и ЕС)
`Mistral-Large-3` Предварительный просмотр	завершение чата	- Входные данные: текст, изображение - Выходные данные: текст - Языки:`en`, `frdeesitptnlzh`, и `jakoar` - Вызов инструмента: Да - Форматы ответов: Текст, JSON	— глобальный стандарт (все регионы) — стандарт зоны данных (США и ЕС)

Несколько моделей Mistral также доступны через партнеров и сообщество.

Модели ИИ Moonshot, проданные Azure

Модели ИИ Moonshot включают Кими K2.6 (предварительная версия) и Кими K2.5 (предварительная версия), многомодальные модели причин, принимающие ввод текста и изображения.

Модель	Тип	Возможности	Тип развертывания (доступность региона)
`Kimi-K2.6` Предварительный просмотр	завершение чата (с контентом аргументации)	- Входные данные: текст и изображение (262 144 токенов) - Выходные данные: текст (262 144 токена) - Языки:`en` И `zh` - Вызов инструмента: Да - Форматы ответов: Текст	— глобальный стандарт (все регионы)
`Kimi-K2.5` Предварительный просмотр	завершение чата (с контентом аргументации)	- Входные данные: текст и изображение (262 144 токенов) - Выходные данные: текст (262 144 токена) - Языки:`en` И `zh` - Вызов инструмента: Да - Форматы ответов: Текст	— глобальный стандарт (все регионы)

См . эту коллекцию моделей на портале Foundry.

Модели xAI, проданные Azure

Модели Grok xAI в Foundry Models включают разнообразный набор моделей с логическими и нелогическими способностями, предназначенных для корпоративных случаев использования, таких как извлечение данных, кодирование, сводка текста и агентные приложения.

Регистрация требуется для доступа кgrok-code-fast-1 (предварительная версия) и grok-4.

Модель	Тип	Возможности	Тип развертывания (доступность региона)
`grok-4.3` Предварительный просмотр	завершение чата	- Входные данные: текст (200 000 маркеров) - Выходные данные: текст (8 192 токенов) - Языки:`en` - Вызов инструмента: да - Форматы ответов: текст	— глобальный стандарт (все регионы)
`grok-4-20-reasoning` Предварительный просмотр	завершение чата	- Входные данные: текст (262 000 токенов) - Выходные данные: текст (8 192 токенов) - Языки:`en` - Вызов инструмента: да - Форматы ответов: текст	— глобальный стандарт (все регионы)
`grok-4-20-non-reasoning` Предварительный просмотр	завершение чата	- Входные данные: текст (262 000 токенов) - Выходные данные: текст (8 192 токенов) - Языки:`en` - Вызов инструмента: да - Форматы ответов: текст	— глобальный стандарт (все регионы)
`grok-4.1-fast-reasoning` Предварительный просмотр	завершение чата	- Входные данные: текст, изображение (128 000 токенов) - Выходные данные: текст (128 000 маркеров) - Языки:`en` - Вызов инструмента: да - Форматы ответов: текст	— глобальный стандарт (все регионы)
`grok-4.1-fast-non-reasoning` Предварительный просмотр	завершение чата	- Входные данные: текст, изображение (128 000 токенов) - Выходные данные: текст (128 000 маркеров) - Языки:`en` - Вызов инструмента: да - Форматы ответов: текст	— глобальный стандарт (все регионы)
`grok-4`	завершение чата	- Входные данные: текст (262 000 токенов) - Выходные данные: текст (8 192 токенов) - Языки:`en` - Вызов инструмента: да - Форматы ответов: текст	— глобальный стандарт (все регионы)
`grok-code-fast-1` Предварительный просмотр	завершение чата	- Входные данные: текст (256 000 маркеров) - Выходные данные: текст (8 192 токенов) - Языки:`en` - Вызов инструмента: да - Форматы ответов: текст	— глобальный стандарт (все регионы)

Доступность региона модели по типу развертывания

Microsoft Foundry предоставляет клиентам выбор в структуре размещения, которая соответствует их бизнесу и шаблонам использования. Служба предлагает две основные категории развертывания:

Стандарт: имеет глобальный вариант развертывания, маршрутизация трафика глобально для обеспечения более высокой пропускной способности.
Provisioned: также имеет глобальный вариант развертывания, позволяющий клиентам приобретать и развертывать подготовленные вычислительные единицы пропускной способности в глобальной инфраструктуре Azure.

Также доступны другие типы развертывания, такие как пакетная. Чтобы узнать о всех доступных типах развертывания моделей, см. Deployment types for Microsoft Foundry Models.

Доступность модели Global Standard

Регион	FLUX.2-flex	FLUX.2-pro	FLUX.1-Kontext-pro	FLUX-1.1-pro	Cohere-rerank-v4.0-pro	Cohere-rerank-v4.0-fast	cohere-command-a	embed-v-4-0	DeepSeek-V3.2-Speciale	DeepSeek-V3.2	DeepSeek-V3.1	DeepSeek-R1-0528	DeepSeek-V3-0324	DeepSeek-R1	Лама-4-Maverick-17B-128E-Instruct-FP8	Лама-3.3-70B-Instruct	MAI-Image-2	модель маршрутизатора	mistral-document-ai-2512	mistral-document-ai-2505	Мистраль-Большой-3	Кими-K2.5	grok-4-1-fast-reasoning	grok-4-1-fast-non-reasoning	grok-4-fast-reasoning	grok-4-fast-non-reasoning	grok-3	grok-3-mini
австралия восток	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
бразилия-юг	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
canadacentral	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
canadaeast	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
centralus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
eastus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
eastus2	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
francecentral	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
germanywestcentral	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
италиянорт	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
japaneast	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
japanwest	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
koreacentral	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
northcentralus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Норвегия восток	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
ПольшаЦентраль	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
southafricanorth	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
southcentralus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Южная Индия	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
spaincentral	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Швецияcentral	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
ШвейцарияНорт	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
швейцариязапад	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
уаенорт	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
uksouth	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
westcentralus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
westeurope	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
westus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
westus2	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
westus3	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅

Доступность глобальной подготовленной управляемой модели

Регион	DeepSeek-R1-0528	DeepSeek-V3-0324	DeepSeek-R1	Лама-3.3-70B-Instruct
австралия восток	✅	✅	✅	✅
бразилия-юг	✅	✅	✅	✅
canadacentral	✅	✅	✅	✅
canadaeast	✅	✅	✅	✅
centralus	✅	✅	✅	✅
eastus	✅	✅	✅	✅
eastus2	✅	✅	✅	✅
francecentral	✅	✅	✅	✅
germanywestcentral	✅	✅	✅	✅
италиянорт	✅	✅	✅	✅
japaneast	✅	✅	✅	✅
japanwest	✅	✅	✅	✅
koreacentral	✅	✅	✅	✅
northcentralus	✅	✅	✅	✅
Норвегия восток	✅	✅	✅	✅
ПольшаЦентраль	✅	✅	✅	✅
southafricanorth	✅	✅	✅	✅
southcentralus	✅	✅	✅	✅
Южная Индия	✅	✅	✅	✅
spaincentral	✅	✅	✅	✅
Швецияcentral	✅	✅	✅	✅
ШвейцарияНорт	✅	✅	✅	✅
швейцариязапад	✅	✅	✅	✅
уаенорт	✅	✅	✅	✅
uksouth	✅	✅	✅	✅
westcentralus	✅	✅	✅	✅
westeurope	✅	✅	✅	✅
westus	✅	✅	✅	✅
westus2	✅	✅	✅	✅
westus3	✅	✅	✅	✅

Доступность стандартной модели для зоны данных

Регион	FLUX.2-pro	FLUX.1-Kontext-pro	FLUX-1.1-pro	модель маршрутизатора	mistral-document-ai-2512	mistral-document-ai-2505	Мистраль-Большой-3	grok-4-1-fast-reasoning	grok-4-1-fast-non-reasoning	grok-4-fast-reasoning	grok-4-fast-non-reasoning	grok-3	grok-3-mini
centralus	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
eastus	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
eastus2	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
francecentral	✅	✅	✅	-	✅	✅	✅	-	-	-	-	-	-
germanywestcentral	✅	✅	✅	-	✅	✅	✅	-	-	-	-	-	-
италиянорт	✅	✅	✅	-	✅	✅	✅	-	-	-	-	-	-
northcentralus	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
ПольшаЦентраль	✅	✅	✅	-	✅	✅	✅	-	-	-	-	-	-
southcentralus	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
spaincentral	✅	✅	✅	-	✅	✅	✅	-	-	-	-	-	-
Швецияcentral	✅	✅	✅	✅	✅	✅	✅	-	-	-	-	-	-
westcentralus	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
westeurope	✅	✅	✅	-	✅	✅	✅	-	-	-	-	-	-
westus	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
westus2	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
westus3	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅

Обратная связь

Были ли сведения на этой странице полезными?

Last updated on 2026-05-13

Модели Foundry, предлагаемые Azure

Azure OpenAI в моделях Microsoft Foundry

Основные моменты модели

новый чат GPT

Возможности

GPT-5.5

Возможности

GPT-5.4

Возможности

GPT-5.3

Возможности

GPT-5.2

Возможности

GPT-5.1

Возможности

GPT-5

Возможности

gpt-oss

Возможности

Развертывание с помощью кода

Серия GPT-4.1

Возможности

Известная проблема

компьютерная предварительная версия

Возможности

модели o-серии

Возможности

GPT-4o и GPT-4 Turbo

Модели GPT-4 и GPT-4 Turbo

Возможности

Встраивания

Возможности

Модели создания изображений

Модели создания видео

Звуковые модели

Аудиомодели GPT-4o

API аудио

Модели преобразования речи в текст

Модели перевода речи

Модели преобразования текста в речь (предварительная версия)

Модели для тонкой настройки

Помощники (предварительная версия)

Вывод модели из эксплуатации

Связанное содержимое

Модели Black Forest Labs, проданные Azure

модели Cohere, доступные в Azure

Модели DeepSeek, проданные Azure

Метамодели, проданные Azure

Модели Microsoft, продаваемые через Azure

Модели Mistral, продаваемые в Azure

Модели ИИ Moonshot, проданные Azure

Модели xAI, проданные Azure

Доступность региона модели по типу развертывания

Доступность модели Global Standard

Связанное содержимое

Обратная связь

Дополнительные ресурсы