Литейные модели, проданные непосредственно Azure

Microsoft Модели Foundry в каталоге моделей состоят из двух основных категорий, а именно Foundry Models, проданных непосредственно Azure и Foundry Models от партнеров и сообщества. В этой статье приводится выбор моделей Foundry, проданных непосредственно Azure, а также их возможностей, deployment типов и регионов доступности, за исключением устаревших и устаревших моделей. Модели Foundry, проданные непосредственно Azure, также называются Direct из Azure models или Azure Direct Models.

Модели, проданные непосредственно Azure включают все Azure модели OpenAI и определенные, выбранные модели из лучших поставщиков. Эти модели выставляются через подписку Azure, охватываются Azure соглашениями об уровне обслуживания и поддерживаются Microsoft. Список моделей Foundry, поддерживаемых службой агентов Foundry, см. в разделе " Модели, поддерживаемые службой агента", а также список моделей Foundry от партнеров, см. в разделе "Модели Foundry" от партнеров и сообщества.

Совет

Используйте вкладки в верхней части этой страницы, чтобы переключаться между моделями Azure OpenAI и Other model collections от поставщиков, таких как Cohere, DeepSeek, Meta, Mistral AI и xAI.

Azure OpenAI в моделях Microsoft Foundry

Azure OpenAI работает с различным набором моделей с разными возможностями и ценовыми точками. Доступность модели зависит от региона и облака. Сведения о доступности модели Azure для государственных организаций см. в Azure OpenAI в Azure для государственных организаций.

Модели Описание
Серия GPT-5.5 Новые функцииgpt-5.5
Серия GPT-5.4 NEWgpt-5.4-mini, , gpt-5.4-nano, gpt-5.4gpt-5.4-pro
Серия GPT-5.3 gpt-5.3-chat, gpt-5.3-codex
Серия GPT-5.2 gpt-5.2-codex, , gpt-5.2gpt-5.2-chatпредварительная версия
Серия GPT-5.1 gpt-5.1, gpt-5.1-chatпредварительная версия, , gpt-5.1-codexgpt-5.1-codex-mini
Сора НОВАЯ сора-2
Серия GPT-5 gpt-5, , gpt-5-mini, gpt-5-chatgpt-5-nanoпредварительная версия
gpt-oss Модели причин открытого веса
codex-mini Точно настроенная версия o4-mini.
Серия GPT-4.1 gpt-4.1, , gpt-4.1-minigpt-4.1-nano
компьютерная предварительная версия Экспериментальная модель, обученная для использования с компьютером API ответов.
модели o-серии Модели рассуждений с расширенным решением проблем и повышением фокуса и возможностей.
GPT-4o, GPT-4o mini и GPT-4 Turbo Возможность Azure моделей OpenAI с многомодальными версиями, которые могут принимать как текст, так и изображения в качестве входных данных.
Внедрение Набор моделей, которые могут преобразовать текст в числовую векторную форму для упрощения сходства текста.
Создание образа Серия моделей, которые могут создавать исходные изображения на естественном языке.
Video generation Модель, которая может создавать исходные видео-сцены из текстовых инструкций.
Аудио Серия моделей для преобразования речи в текст, перевод и текст в речь. Звуковые модели GPT-4o поддерживают речь с низкой задержкой , взаимодействие с речью вне беседы или создание звука.

GPT-5.5

Модели Регионе
gpt-5.5 Глобальный стандарт:
Восточная часть США2
Центральная Швеция
Южная часть США
Центральная Польша

Datazone Standard:
Восточная часть США2
Южная часть США
Центральная Польша
Центральная Швеция
Идентификатор модели Описание Окно контекста Максимальное количество выходных маркеров Учебные данные (до)
gpt-5.5 (2026-04-24) - Рассуждения
- API ответов.
— API завершения чата.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции, инструменты и параллельные вызовы инструментов.
- Использование компьютера
- Полная сводка возможностей.
1050 000 br>
Входные данные: 922 000
Выходные данные: 128 000
128,000 Декабрь 2025 г.

Примечание

Для развертывания этой модели для некоторых уровней квот потребуется запрашивать квоты gpt-5.5 . По умолчанию подписки уровня 5 и 6 имеют квоту.

GPT-5.4

Модели Регионе
gpt-5.4 См . таблицу моделей
gpt-5.4-pro См . таблицу моделей
gpt-5.4-mini См . таблицу моделей
gpt-5.4-nano См . таблицу моделей
Идентификатор модели Описание Окно контекста Максимальное количество выходных маркеров Учебные данные (до)
gpt-5.4 (2026-03-05) - Рассуждения
- API ответов.
— API завершения чата.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции, инструменты и параллельные вызовы инструментов.
- Использование компьютера
- Полная сводка возможностей.
1,050,000 128,000 Август 2025 г.
gpt-5.4-pro (2026-03-05) - Рассуждения
- API ответов.
— Обработка текста и изображения.
— Функции и инструменты
- Полная сводка возможностей.
1,050,000 128,000 Август 2025 г.
gpt-5.4-mini (2026-03-17) - Рассуждения
- API ответов.
— API завершения чата.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции, инструменты и параллельные вызовы инструментов.
- Использование компьютера
- Полная сводка возможностей.
400,000

Входные данные: 272 000
Выходные данные: 128 000
128,000 Август 2025 г.
gpt-5.4-nano (2026-03-17) - Рассуждения
- API ответов.
— API завершения чата.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции, инструменты и параллельные вызовы инструментов.
- Полная сводка возможностей.
400,000

Входные данные: 272 000
Выходные данные: 128 000
128,000 Август 2025 г.

GPT-5.3

Модели Регионе
gpt-5.3-codex См . таблицу моделей
gpt-5.3-chat Восточная часть США2 и Центральная Швеция (глобальный стандарт)
Идентификатор модели Описание Окно контекста Максимальное количество выходных маркеров Учебные данные (до)
gpt-5.3-codex (2026-02-24) - Рассуждения
- API ответов.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции, инструменты и параллельные вызовы инструментов.
- Полная сводка возможностей.
— Оптимизировано для расширения Codex CLI и Codex VS Code
400,000

Входные данные: 272 000
Выходные данные: 128 000
128,000 Август 2025 г.
gpt-5.3-chat (2026-03-03)
Предварительный просмотр
— API завершения чата.
- API ответов.
— структурированные выходные данные
— Функции, инструменты и параллельные вызовы инструментов.
128,000

Входные данные: 111 616
Выходные данные: 16 384
16,384 Август 2025 г.

GPT-5.2

Доступность региона

Модели Регионе
gpt-5.2 См. таблицу моделей.
gpt-5.2-chat Предварительный просмотр См. таблицу моделей.
gpt-5.2-codex См . таблицу моделей
Идентификатор модели Описание Окно контекста Максимальное количество выходных маркеров Учебные данные (до)
gpt-5.2-codex (2026-01-14) - Рассуждения
- API ответов.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции, инструменты и параллельные вызовы инструментов.
- Полная сводка возможностей.
— Оптимизировано для расширения Codex CLI и Codex VS Code
400,000

Входные данные: 272 000
Выходные данные: 128 000
128,000
gpt-5.2 (2025-12-11) - Рассуждения
— API завершения чата.
- API ответов.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции, инструменты и параллельные вызовы инструментов.
- Полная сводка возможностей.
400,000

Входные данные: 272 000
Выходные данные: 128 000
128,000 Август 2025 г.
gpt-5.2-chat (2025-12-11)
Предварительный просмотр
— API завершения чата.
- API ответов.
— структурированные выходные данные
— Функции, инструменты и параллельные вызовы инструментов.
128,000

Входные данные: 111 616
Выходные данные: 16 384
16,384 Август 2025 г.
gpt-5.2-chat (2026-02-10)
Предварительный просмотр
— API завершения чата.
- API ответов.
— структурированные выходные данные
— Функции, инструменты и параллельные вызовы инструментов.
128,000

Входные данные: 111 616
Выходные данные: 16 384
16,384 Август 2025 г.

Осторожностью

Мы не рекомендуем использовать предварительные версии моделей в рабочей среде. Мы обновим все развертывания моделей предварительной версии до будущих версий предварительной версии или до последней стабильной общедоступной версии. Модели, назначенные предварительной версией, не соответствуют стандартному жизненному циклу модели OpenAI Azure.

GPT-5.1

Доступность региона

Модели Регионе
gpt-5.1 См. таблицу моделей.
gpt-5.1-chat Предварительный просмотр См. таблицу моделей.
gpt-5.1-codex См. таблицу моделей.
gpt-5.1-codex-mini См. таблицу моделей.
gpt-5.1-codex-max См. таблицу моделей.
Идентификатор модели Описание Окно контекста Максимальное количество выходных маркеров Учебные данные (до)
gpt-5.1 (2025-11-13) - Рассуждения
— API завершения чата.
- API ответов.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции, инструменты и параллельные вызовы инструментов.
- Полная сводка возможностей.
400,000

Входные данные: 272 000
Выходные данные: 128 000
128,000 30 сентября 2024 г.
gpt-5.1-chat (2025-11-13)
Предварительный просмотр
- Рассуждения
— API завершения чата.
- API ответов.
— структурированные выходные данные
— Функции, инструменты и параллельные вызовы инструментов.
128,000

Входные данные: 111 616
Выходные данные: 16 384
16,384 30 сентября 2024 г.
gpt-5.1-codex (2025-11-13) - Только API ответов .
— Обработка текста и изображений
— структурированные выходные данные.
— Функции, инструменты и параллельные вызовы инструментов.
- Полная сводка возможностей
— Оптимизировано для расширения Codex CLI и Codex VS Code
400,000

Входные данные: 272 000
Выходные данные: 128 000
128,000 30 сентября 2024 г.
gpt-5.1-codex-mini (2025-11-13) - Только API ответов .
— Обработка текста и изображений
— структурированные выходные данные.
— Функции, инструменты и параллельные вызовы инструментов.
- Полная сводка возможностей
— Оптимизировано для расширения Codex CLI и Codex VS Code
400,000

Входные данные: 272 000
Выходные данные: 128 000
128,000 30 сентября 2024 г.
gpt-5.1-codex-max (2025-12-04) - Только API ответов .
— Обработка текста и изображений
— структурированные выходные данные.
— Функции, инструменты и параллельные вызовы инструментов.
- Полная сводка возможностей
— Оптимизировано для расширения Codex CLI и Codex VS Code
400,000

Входные данные: 272 000
Выходные данные: 128 000
128,000 30 сентября 2024 г.

Осторожностью

Мы не рекомендуем использовать предварительные версии моделей в рабочей среде. Мы обновим все развертывания моделей предварительной версии до будущих версий предварительной версии или до последней стабильной общедоступной версии. Модели, назначенные предварительной версией, не соответствуют стандартному жизненному циклу модели OpenAI Azure.

Важно

  • gpt-5.1 reasoning_effort значение noneпо умолчанию . При обновлении предыдущих моделей gpt-5.1причин следует помнить, что может потребоваться обновить код, чтобы явно передать reasoning_effort уровень, если требуется выполнить причину.

  • gpt-5.1-chat добавляет встроенные возможности рассуждений. Как и другие модели причин , они не поддерживают такие параметры temperature. При обновлении от использования gpt-5-chat (которая не является моделью причин) gpt-5.1-chat убедитесь, что вы удаляете пользовательские параметры, такие как temperature из кода, которые не поддерживаются моделями причин.

  • gpt-5.1-codex-max добавляет поддержку параметра reasoning_effortxhighв . Аргументирование не none поддерживается gpt-5.1-codex-max.

GPT-5

Доступность региона

Модели Регионе
gpt-5 (2025-08-07) См. таблицу моделей.
gpt-5-mini (2025-08-07) См. таблицу моделей.
gpt-5-nano (2025-08-07) См. таблицу моделей.
gpt-5-chat (2025-08-07) Предварительная версия См. таблицу моделей.
gpt-5-chat (2025-10-03) Предварительная версия См. таблицу моделей.
gpt-5-codex (2025-09-11) См. таблицу моделей.
gpt-5-pro (2025-10-06) См. таблицу моделей.
Идентификатор модели Описание Окно контекста Максимальное количество выходных маркеров Учебные данные (до)
gpt-5 (2025-08-07) - Рассуждения
— API завершения чата.
- API ответов.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции, инструменты и параллельные вызовы инструментов.
- Полная сводка возможностей.
400,000

Входные данные: 272 000
Выходные данные: 128 000
128,000 30 сентября 2024 г.
gpt-5-mini (2025-08-07) - Рассуждения
— API завершения чата.
- API ответов.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции, инструменты и параллельные вызовы инструментов.
- Полная сводка возможностей.
400,000

Входные данные: 272 000
Выходные данные: 128 000
128,000 31 мая 2024 г.
gpt-5-nano (2025-08-07) - Рассуждения
— API завершения чата.
- API ответов.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции, инструменты и параллельные вызовы инструментов.
- Полная сводка возможностей.
400,000

Входные данные: 272 000
Выходные данные: 128 000
128,000 31 мая 2024 г.
gpt-5-chat (2025-08-07)
Предварительный просмотр
— API завершения чата.
- API ответов.
- Входные данные: текст и изображение
- Выходные данные: только текст
128,000 16,384 30 сентября 2024 г.
gpt-5-chat (2025-10-03)
Предварительный просмотр1
— API завершения чата.
- API ответов.
- Входные данные: текст и изображение
- Выходные данные: только текст
128,000 16,384 30 сентября 2024 г.
gpt-5-codex (2025-09-11) - Только API ответов .
- Входные данные: текст и изображение
- Выходные данные: только текст
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции, инструменты и параллельные вызовы инструментов.
- Полная сводка возможностей
— Оптимизировано для расширения Codex CLI и Codex VS Code
400,000

Входные данные: 272 000
Выходные данные: 128 000
128,000 -
gpt-5-pro (2025-10-06) - Рассуждения
- API ответов.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции и инструменты
- Полная сводка возможностей.
400,000

Входные данные: 272 000
Выходные данные: 128 000
128,000 30 сентября 2024 г.

Примечание

1gpt-5-chat версия 2025-10-03 представляет значительное улучшение, ориентированное на эмоциональный интеллект и возможности психического здоровья. Это обновление интегрирует специализированные наборы данных и усовершенствованные стратегии реагирования для улучшения способности модели:

  • Узнайте и интерпретируйте эмоциональный контекст более точно, обеспечивая нюансы и сочувствие взаимодействия.
  • Обеспечение поддержки, ответственного реагирования на беседы , связанные с психическим здоровьем, обеспечение конфиденциальности и соблюдения рекомендаций.

Эти улучшения стремятся сделать GPT-5-чат более контекстно осведомленным, ориентированным на человека и надежным в сценариях, где эмоциональный тон и благополучие являются критически важными.

Осторожностью

Мы не рекомендуем использовать предварительные версии моделей в рабочей среде. Мы обновим все развертывания моделей предварительной версии до будущих версий предварительной версии или до последней стабильной общедоступной версии. Модели, назначенные предварительной версией, не соответствуют стандартному жизненному циклу модели OpenAI Azure.

gpt-oss

Доступность региона

Модели Регионе
gpt-oss-120b Все Azure регионы OpenAI

Возможности

Идентификатор модели Описание Окно контекста Максимальное количество выходных маркеров Учебные данные (до)
gpt-oss-120b (предварительная версия) — только текст в/тексте
— API завершения чата
-Потокового
— Вызов функции
— структурированные выходные данные
-Рассуждения
— доступно для развертывания1 и с помощью управляемых вычислений
131,072 131,072 31 мая 2024 г.
gpt-oss-20b (предварительная версия) — только текст в/тексте
— API завершения чата
-Потокового
— Вызов функции
— структурированные выходные данные
-Рассуждения
— доступно с помощью управляемых вычислений и литейных локальных вычислений
131,072 131,072 31 мая 2024 г.

1 В отличие от других моделей OpenAI Azure gpt-oss-120b требуется проект Foundry для развертывания модели.

Развертывание с помощью кода

az cognitiveservices account deployment create \
  --name "Foundry-project-resource" \
  --resource-group "test-rg" \
  --deployment-name "gpt-oss-120b" \
  --model-name "gpt-oss-120b" \
  --model-version "1" \
  --model-format "OpenAI-OSS" \
  --sku-capacity 10 \
  --sku-name "GlobalStandard"

Серия GPT-4.1

Доступность региона

Модели Регионе
gpt-4.1 (2025-04-14) См. таблицу моделей.
gpt-4.1-nano (2025-04-14) См. таблицу моделей.
gpt-4.1-mini (2025-04-14) См. таблицу моделей.

Возможности

Важно

Известная проблема влияет на все модели серии GPT 4.1. Крупные определения вызовов инструментов или функций, превышающие 300 000 маркеров, приводят к сбоям, даже если не достигнут предел контекста маркера в 1 млн.

Ошибки могут отличаться на основе вызовов API и базовых характеристик полезных данных.

Ниже приведены сообщения об ошибках ДЛЯ API завершения чата:

  • Error code: 400 - {'error': {'message': "This model's maximum context length is 300000 tokens. However, your messages resulted in 350564 tokens (100 in the messages, 350464 in the functions). Please reduce the length of the messages or functions.", 'type': 'invalid_request_error', 'param': 'messages', 'code': 'context_length_exceeded'}}

  • Error code: 400 - {'error': {'message': "Invalid 'tools[0].function.description': string too long. Expected a string with maximum length 1048576, but got a string with length 2778531 instead.", 'type': 'invalid_request_error', 'param': 'tools[0].function.description', 'code': 'string_above_max_length'}}

Ниже приведено сообщение об ошибке ДЛЯ API ответов:

  • Error code: 500 - {'error': {'message': 'The server had an error processing your request. Sorry about that! You can retry your request, or contact us through an Azure support request at: https://go.microsoft.com/fwlink/?linkid=2213926 if you keep seeing this error. (Please include the request ID d2008353-291d-428f-adc1-defb5d9fb109 in your email.)', 'type': 'server_error', 'param': None, 'code': None}}
Идентификатор модели Описание Окно контекста Максимальное количество выходных маркеров Обучающие данные (до)
gpt-4.1 (2025-04-14) — ввод текста и изображения
— вывод текста
— API завершения чата
— API ответов
-Потокового
— Вызов функции
— структурированные выходные данные (завершение чата)
- 1,047,576
— 300 000 (стандартные и подготовленные управляемые развертывания)
- 128 000 (пакетные развертывания)
32,768 31 мая 2024 г.
gpt-4.1-nano (2025-04-14) — ввод текста и изображения
— вывод текста
— API завершения чата
— API ответов
-Потокового
— Вызов функции
— структурированные выходные данные (завершение чата)
- 1,047,576
— 300 000 (стандартные и подготовленные управляемые развертывания)
- 128 000 (пакетные развертывания)
32,768 31 мая 2024 г.
gpt-4.1-mini (2025-04-14) — ввод текста и изображения
— вывод текста
— API завершения чата
— API ответов
-Потокового
— Вызов функции
— структурированные выходные данные (завершение чата)
- 1,047,576
— 300 000 (стандартные и подготовленные управляемые развертывания)
- 128 000 (пакетные развертывания)
32,768 31 мая 2024 г.

компьютерная предварительная версия

Экспериментальная модель, обученная для использования с компьютером API ответов .

Его можно использовать с сторонними библиотеками, чтобы позволить модели управлять вводом мыши и клавиатуры, а также получать контекст из снимков экрана текущей среды.

Осторожностью

Мы не рекомендуем использовать предварительные версии моделей в рабочей среде. Мы обновим все развертывания моделей предварительной версии до будущих версий предварительной версии или до последней стабильной общедоступной версии. Модели, назначенные предварительной версией, не соответствуют стандартному жизненному циклу модели OpenAI Azure.

Для доступа computer-use-previewтребуется регистрация. Доступ предоставляется на основе критериев соответствия Microsoft. Клиенты, имеющие доступ к другим моделям ограниченного доступа, по-прежнему должны запрашивать доступ к этой модели.

Чтобы запросить доступ, перейдите к приложениюcomputer-use-preview модели ограниченного доступа. При предоставлении доступа необходимо создать развертывание для модели.

Доступность региона

Модели Регионе
computer-use-preview См. таблицу моделей.

Возможности

Идентификатор модели Описание Окно контекста Максимальное количество выходных маркеров Обучающие данные (до)
computer-use-preview (2025-03-11) Специализированная модель для использования с компьютером API ответов

-Инструменты
-Потокового
— Текст (входные и выходные данные)
— изображение (входные данные)
8,192 1,024 Октябрь 2023 г.

модели o-серии

Модели Azure o-серии OpenAI предназначены для решения проблем и задач решения проблем с повышенным фокусом и возможностями. Эти модели тратят больше времени на обработку и понимание запроса пользователя, что делает их исключительно сильными в таких областях, как наука, программирование и математика, по сравнению с предыдущими итерациями.

Идентификатор модели Описание Максимальный запрос (токены) Обучающие данные (до)
codex-mini (2025-05-16) Точно настроенная версия o4-mini.
- API ответов.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции и инструменты.
Полная сводка возможностей.
Входные данные: 200 000
Выходные данные: 100 000
31 мая 2024 г.
o3-pro (2025-06-10) - API ответов.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции и инструменты.
Полная сводка возможностей.
Входные данные: 200 000
Выходные данные: 100 000
31 мая 2024 г.
o4-mini (2025-04-16) - Новая модель рассуждений, предлагающая расширенные возможности аргументирования.
— API завершения чата.
- API ответов.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции и инструменты.
Полная сводка возможностей.
Входные данные: 200 000
Выходные данные: 100 000
31 мая 2024 г.
o3 (2025-04-16) - Новая модель рассуждений, предлагающая расширенные возможности аргументирования.
— API завершения чата.
- API ответов.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции, инструменты и параллельные вызовы инструментов.
Полная сводка возможностей.
Входные данные: 200 000
Выходные данные: 100 000
31 мая 2024 г.
o3-mini (2025-01-31) - Расширенные способности рассудка.
— структурированные выходные данные.
— обработка только для текста.
— Функции и инструменты.
Входные данные: 200 000
Выходные данные: 100 000
Октябрь 2023 г.
o1 (2024-12-17) - Расширенные способности рассудка.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции и инструменты.
Входные данные: 200 000
Выходные данные: 100 000
Октябрь 2023 г.
o1-preview (2024-09-12) Более ранняя предварительная версия. Входные данные: 128 000
Выходные данные: 32 768
Октябрь 2023 г.
o1-mini (2024-09-12) Более быстрый и более экономичный вариант в серии o1 идеально подходит для задач программирования, требующих скорости и снижения потребления ресурсов.
— Глобальное развертывание уровня "Стандартный", доступное по умолчанию.
— Развертывания уровня "Стандартный" (региональные) в настоящее время доступны только для тех клиентов, которые получили доступ в рамках выпуска ограниченного o1-preview доступа.
Входные данные: 128 000
Выходные данные: 65 536
Октябрь 2023 г.

Дополнительные сведения о расширенных моделях серии o см. в статье "Начало работы с моделями причин".

Доступность региона

Модели Регионе
codex-mini Восточная часть США 2 и Центральная Швеция (глобальный стандарт).
o3-pro Восточная часть США 2 и Центральная Швеция (глобальный стандарт).
o4-mini См. таблицу моделей.
o3 См. таблицу моделей.
o3-mini См. таблицу моделей.
o1 См. таблицу моделей.
o1-preview См. таблицу моделей. Эта модель доступна только для клиентов, которым предоставлен доступ в рамках исходного ограниченного доступа.
o1-mini См. таблицу моделей.

GPT-4o и GPT-4 Turbo

GPT-4o интегрирует текст и изображения в одну модель, что позволяет одновременно обрабатывать несколько типов данных. Этот многомодальный подход повышает точность и скорость реагирования на взаимодействие с компьютером. GPT-4o соответствует GPT-4 Turbo в задачах английского текста и программирования, обеспечивая более высокую производительность в задачах, отличных от английского языка, и задачах визуального зрения, устанавливая новые тесты для возможностей искусственного интеллекта.

Модели GPT-4 и GPT-4 Turbo

Эти модели можно использовать только с API завершения чата.

Сведения о том, как Azure OpenAI обрабатывает обновления версий модели, см. в <>. Ознакомьтесь с моделями, чтобы узнать, как просматривать и настраивать параметры версии модели для развертываний GPT-4.

Идентификатор модели Описание Максимальный запрос (токены) Обучающие данные (до)
gpt-4o (2024-11-20)
GPT-4o (Omni)
— структурированные выходные данные.
— Обработка текста и изображения.
— режим JSON.
— параллельный вызов функции.
— улучшенная точность и скорость реагирования.
— Паритетность с английским текстом и задачами программирования по сравнению с GPT-4 Turbo с Vision.
— высокая производительность на языках, отличных от английского языка, и в задачах визуального зрения.
- Улучшенные творческие способности писать.
Входные данные: 128 000
Выходные данные: 16 384
Октябрь 2023 г.
gpt-4o (2024-08-06)
GPT-4o (Omni)
— структурированные выходные данные.
— Обработка текста и изображения.
— режим JSON.
— параллельный вызов функции.
— улучшенная точность и скорость реагирования.
— Паритетность с английским текстом и задачами программирования по сравнению с GPT-4 Turbo с Vision.
— высокая производительность на языках, отличных от английского языка, и в задачах визуального зрения.
Входные данные: 128 000
Выходные данные: 16 384
Октябрь 2023 г.
gpt-4o-mini (2024-07-18)
GPT-4o mini
— Быстрая, недорогая модель с поддержкой идеально подходит для замены моделей серии GPT-3.5 Turbo.
— Обработка текста и изображения.
— режим JSON.
— параллельный вызов функции.
Входные данные: 128 000
Выходные данные: 16 384
Октябрь 2023 г.
gpt-4o (2024-05-13)
GPT-4o (Omni)
— Обработка текста и изображения.
— режим JSON.
— параллельный вызов функции.
— улучшенная точность и скорость реагирования.
— Паритетность с английским текстом и задачами программирования по сравнению с GPT-4 Turbo с Vision.
— высокая производительность на языках, отличных от английского языка, и в задачах визуального зрения.
Входные данные: 128 000
Выходные данные: 4096
Октябрь 2023 г.
gpt-4 (turbo-2024-04-09)
GPT-4 Turbo с vision
Новая общедоступная модель.
— замена всех предыдущих моделейvision-preview GPT-4 (, 1106-Preview, 0125-Preview).
- Доступность компонентов в настоящее время отличается в зависимости от метода ввода и типа развертывания.
Входные данные: 128 000
Выходные данные: 4096
Декабрь 2023 г.

Осторожностью

Мы не рекомендуем использовать предварительные версии моделей в рабочей среде. Мы обновим все развертывания моделей предварительной версии до будущих версий предварительной версии или до последней стабильной общедоступной версии. Модели, назначенные предварительной версией, не соответствуют стандартному жизненному циклу модели OpenAI Azure.

Внедрение

text-embedding-3-large является последней и самой способной моделью внедрения. Невозможно обновить между моделями внедрения. Чтобы перейти с использования text-embedding-ada-002text-embedding-3-large, необходимо создать новые внедрения.

  • text-embedding-3-large
  • text-embedding-3-small
  • text-embedding-ada-002

Отчеты OpenAI, которые показывают, что модели внедрения большого и небольшого третьего поколения обеспечивают более высокую производительность многоязычного извлечения с помощью теста MIRACL . Они по-прежнему поддерживают производительность для английских задач с помощью теста MTEB .

Тест оценки text-embedding-ada-002 text-embedding-3-small text-embedding-3-large
Среднее значение MIRACL 31.4 44.0 54.9
Среднее значение MTEB 61.0 62.3 64.6

Модели внедрения третьего поколения поддерживают уменьшение размера внедрения с помощью нового dimensions параметра. Как правило, более крупные внедрения являются более дорогими с точки зрения вычислений, памяти и хранилища. При настройке количества измерений вы получаете больше контроля над общими затратами и производительностью. Параметр dimensions не поддерживается во всех версиях библиотеки openAI 1.x Python. Чтобы воспользоваться этим параметром, рекомендуется обновить до последней версии: pip install openai --upgrade

Тестирование тестов MTEB в OpenAI показало, что даже если размеры модели третьего text-embeddings-ada-002поколения сокращаются до меньше 1536 измерений, производительность остается немного лучше.

Модели создания изображений

Модели создания изображений создают изображения из текстовых запросов, которые предоставляет пользователь. Модели серии GPT-image-1 включают gpt-image-1, gpt-image-1-miniи gpt-image-1.5.

Доступность региона

Модели Регионе
gpt-image-1 См. таблицу "Модели"
gpt-image-1-mini См . таблицу моделей
gpt-image-1.5 См . таблицу моделей
gpt-image-2 См . таблицу моделей

Модели создания видео

Sora — это модель ИИ из OpenAI, которая может создавать реалистичные и образные видео сцены из текстовых инструкций. Sora находится в предварительной версии.

Доступность региона

Модели Регионе
sora См . таблицу моделей
sora-2 См . таблицу моделей

Звуковые модели

Звуковые модели в Azure OpenAI доступны через API realtime, completions и audio.

Звуковые модели GPT-4o

Звуковые модели GPT-4o являются частью семейства моделей GPT-4o и поддерживают низкую задержку, речь в, речевые взаимодействия или звуковое поколение.

Осторожностью

Мы не рекомендуем использовать предварительные версии моделей в рабочей среде. Мы обновим все развертывания моделей предварительной версии до будущих версий предварительной версии или до последней стабильной общедоступной версии. Модели, назначенные предварительной версией, не соответствуют стандартному жизненному циклу модели OpenAI Azure.

Сведения о максимальных маркерах запроса и обучающих данных доступны в следующей таблице:

Идентификатор модели Описание Максимальный запрос (токены) Обучающие данные (до)
gpt-4o-mini-audio-preview (2024-12-17)
Предварительный просмотр
Звуковая модель для создания звука и текста. Входные данные: 128 000
Выходные данные: 16 384
Сентябрь 2023 г.
gpt-4o-audio-preview (2024-12-17) Звуковая модель для создания звука и текста. Входные данные: 128 000
Выходные данные: 16 384
Сентябрь 2023 г.
gpt-4o-realtime-preview (2025-06-03) Звуковая модель для обработки звука в режиме реального времени. Входные данные: 32 000
Выходные данные: 4096
Октябрь 2023 г.
gpt-4o-realtime-preview (2024-12-17) Звуковая модель для обработки звука в режиме реального времени. Входные данные: 16 000
Выходные данные: 4096
Октябрь 2023 г.
gpt-4o-mini-realtime-preview (2024-12-17)
Предварительный просмотр
Звуковая модель для обработки звука в режиме реального времени. Входные данные: 128 000
Выходные данные: 4096
Октябрь 2023 г.
gpt-audio(2025-08-28)
gpt-audio-mini(2025-10-06)
Звуковая модель для создания звука и текста. Входные данные: 128 00
Выходные данные: 16 384
Октябрь 2023 г.
gpt-realtime (2025-08-28) (GA)
gpt-realtime-mini (2025-10-06)
gpt-realtime-mini (2025-12-15)
Звуковая модель для обработки звука в режиме реального времени. Входные данные: 32 00
Выходные данные: 4096
Октябрь 2023 г.
gpt-audio-1.5 (2026-02-23) Звуковая модель для создания звука и текста. Входные данные: 128 00
Выходные данные: 16 384
Сентябрь 2024 г.
gpt-realtime-1.5 (2026-02-23) Звуковая модель для обработки звука в режиме реального времени. Входные данные: 32 00
Выходные данные: 4096
Сентябрь 2024 г.

Чтобы сравнить доступность звуковых моделей GPT-4o во всех регионах, см. в таблице моделей.

API аудио

Звуковые модели с помощью /audio API можно использовать для преобразования речи в текст, перевод и текст в речь.

Модели преобразования речи в текст

Идентификатор модели Описание Максимальный запрос (размер аудиофайла)
whisper Модель распознавания речи общего назначения. 25 МБ
gpt-4o-transcribe (2025-03-20)
Предварительный просмотр
Модель преобразования речи в текст на основе GPT-4o. 25 МБ
gpt-4o-mini-transcribe (2025-03-20)
Предварительный просмотр
Модель преобразования речи в текст с помощью GPT-4o mini. 25 МБ
gpt-4o-transcribe-diarize (2025-10-15)
Предварительный просмотр
Модель преобразования речи в текст с автоматическим распознаванием речи. 25 МБ
gpt-4o-mini-transcribe (2025-12-15)
Предварительный просмотр
Модель преобразования речи в текст с автоматическим распознаванием речи. Улучшена точность транскрибирования и надежность. 25 МБ

Модели перевода речи

Идентификатор модели Описание Максимальный запрос (размер аудиофайла)
whisper Модель распознавания речи общего назначения. 25 МБ

Модели преобразования текста в речь (предварительная версия)

Идентификатор модели Описание
tts
Предварительный просмотр
Модель преобразования текста в речь, оптимизированная для скорости.
tts-hd
Предварительный просмотр
Модель преобразования текста в речь, оптимизированная для качества.
gpt-4o-mini-tts (2025-03-20) Модель преобразования текста в речь с помощью GPT-4o mini.

Вы можете управлять голосом, чтобы говорить в определенном стиле или тоне.
gpt-4o-mini-tts (2025-12-15) Модель преобразования текста в речь с помощью GPT-4o mini.

Вы можете управлять голосом, чтобы говорить в определенном стиле или тоне.

Сводная таблица модели и доступность региона

Модели по типу развертывания

Azure OpenAI предоставляет клиентам выбор в структуре размещения, которая соответствует своим бизнес-шаблонам и шаблонам использования. Служба предлагает два основных типа развертывания:

  • Стандарт: имеет глобальный вариант развертывания, маршрутизация трафика глобально для обеспечения более высокой пропускной способности.
  • Provisioned: также имеет глобальный вариант развертывания, позволяющий клиентам приобретать и развертывать подготовленные единицы пропускной способности в Azure глобальной инфраструктуре.

Все развертывания могут выполнять те же операции вывода, но выставление счетов, масштабирование и производительность существенно отличаются. Дополнительные сведения о типах развертывания OpenAI Azure см. в руководстве по типам Deployment.

Модели Версия бразилия canadacentral canadaeast centralus eastus eastus2 northcentralus southcentralus westus westus3
gpt-5.5 2026-04-24 - - - - - - - -
gpt-image-2 2026-04-21 - - - - - - - -
gpt-5.4-mini 2026-03-17
gpt-5.4-nano 2026-03-17
gpt-5.4 2026-03-05
gpt-5.4-pro 2026-03-05 - - - - - - - -
gpt-5.3-chat 2026-03-03
gpt-5.3-codex 2026-02-24
gpt-audio-1.5 2026-02-23 - - - - - - - -
gpt-realtime-1.5 2026-02-23 - - - - - - -
gpt-5.2-chat 2026-02-10
gpt-5.2-chat 2025-12-11
gpt-5.2-codex 2026-01-14
gpt-image-1.5 2025-12-16 - - - - - - - -
gpt-4o-mini-transcribe 2025-12-15 - - - - - - -
gpt-4o-mini-transcribe 2025-03-20 - - - - - - -
gpt-4o-mini-tts 2025-12-15 - - - - - - - - -
gpt-4o-mini-tts 2025-03-20 - - - - - - - - -
gpt-audio-mini 2025-12-15 - - - - - - - -
gpt-audio-mini 2025-10-06 - - - - - - - -
gpt-realtime-mini 2025-12-15 - - - - - - -
gpt-realtime-mini 2025-10-06 - - - - - - -
gpt-5.2 2025-12-11
gpt-5.1-codex-max 2025-12-04 - - - - - - - - -
маршрутизатор модели 2025-11-18 - - - - - - - - -
маршрутизатор модели 2025-08-07 - - - - - - - - -
маршрутизатор модели 2025-05-19 - - - - - - - - -
gpt-5.1 2025-11-13
gpt-5.1-chat 2025-11-13
gpt-5.1-codex 2025-11-13
gpt-5.1-codex-mini 2025-11-13
gpt-4o-transcribe-diarize 2025-10-15 - - - - - - -
gpt-5-pro 2025-10-06 -
gpt-image-1-mini 2025-10-06 - - - - - - - -
sora-2 2025-10-06 - - - - - - - - -
gpt-5-chat 2025-10-03 -
gpt-5-chat 2025-08-07 -
gpt-5-codex 2025-09-15 -
gpt-audio 2025-08-28 - - - - - - - -
gpt-realtime 2025-08-28 - - - - - - -
gpt-5 2025-08-07 -
gpt-5-mini 2025-08-07 -
gpt-5-nano 2025-08-07 -
o3-deep-research 2025-06-26 - - - - - - - - -
o3-pro 2025-06-10 - - - - - - - -
codex-mini 2025-05-16 - - - - - - - -
o3 2025-04-16 -
o4-mini 2025-04-16 -
gpt-image-1 2025-04-15 - - - - - - - -
gpt-4.1 2025-04-14 -
gpt-4.1-mini 2025-04-14 -
gpt-4.1-nano 2025-04-14 -
gpt-4o-transcribe 2025-03-20 - - - - - - -
компьютерная предварительная версия 2025-03-11 - - - - - - - - -
o3-mini 2025-01-31 -
o1 2024-12-17 -
gpt-4o 2024-11-20 -
gpt-4o 2024-08-06 -
gpt-4o 2024-05-13 -
gpt-4o-mini 2024-07-18 -
text-embedding-ada-002 2 - -
text-embedding-3-large 1 -
text-embedding-3-small 1 -

Примечание

  • o3-deep-research в настоящее время доступен только в службе агента Foundry. Дополнительные сведения см. в руководстве по глубокому исследованию.

  • o1-mini в настоящее время доступен всем клиентам для развертывания Global Standard. Выбор клиентов был предоставлен стандартный (региональный) доступ к o1-mini развертыванию в рамках выпуска ограниченного o1-preview доступа. В настоящее время доступ к стандартным o1-mini (региональным) развертываниям не расширяется.

  • Подготовленная версия версии gpt-4turbo-2024-04-09 в настоящее время ограничена только текстом. Дополнительные сведения о подготовленных развертываниях см. в руководстве по подготовке.

Эта таблица не содержит сведения о точной настройке региональной доступности. Ознакомьтесь с разделом по настройке этих сведений.

Модели внедрения

Эти модели можно использовать только с запросами API внедрения.

Примечание

text-embedding-3-large является последней и самой способной моделью внедрения. Невозможно обновить между моделями внедрения. Чтобы выполнить миграцию с использования text-embedding-ada-002text-embedding-3-large, необходимо создать новые внедрения.

Идентификатор модели Максимальный запрос (токены) Измерения выходных данных Обучающие данные (до)
text-embedding-ada-002 (версия 2) 8,192 1,536 Сентябрь 2021 г.
text-embedding-ada-002 (версия 1) 2,046 1,536 Сентябрь 2021 г.
text-embedding-3-large 8,192 3,072 Сентябрь 2021 г.
text-embedding-3-small 8,192 1,536 Сентябрь 2021 г.

Примечание

При отправке массива входных данных для внедрения максимальное количество входных элементов в массиве на вызов конечной точки внедрения составляет 2048.

Модели создания изображений

Идентификатор модели Максимальный запрос (символы)
gpt-image-1 4,000
gpt-image-1-mini 4,000
gpt-image-1.5 4,000

Модели создания видео

Идентификатор модели Максимальный запрос (символы)
Сора 4,000

Модели точной настройки

Для точной настройки поддерживаются следующие модели:

Идентификатор модели Стандартные регионы Глобального Разработчик Методы Статус Модальности
gpt-4o-mini
(2024-07-18)
Северная часть США
Центральная Швеция
SFT GA Текст в текст
gpt-4o
(2024-08-06)
Восточная часть США2
Северная часть США
Центральная Швеция
SFT, DPO GA Текст и визуальное представление для текста
gpt-4.1
(2025-04-14)
Северная часть США
Центральная Швеция
SFT, DPO GA Текст и визуальное представление для текста
gpt-4.1-mini
(2025-04-14)
Северная часть США
Центральная Швеция
SFT, DPO GA Текст в текст
gpt-4.1-nano (2025-04-14) Северная часть США
Центральная Швеция
SFT, DPO GA Текст в текст
o4-mini
(2025-04-16)
Восточная часть США2
Центральная Швеция
RFT GA Текст в текст
gpt-5
(2025-08-07)
Северная часть США
Центральная Швеция
RFT Частная предварительная версия Текст в текст
Ministral-3B
(2411)
Не поддерживается SFT Общедоступная предварительная версия Текст в текст
Qwen-32B Не поддерживается SFT Общедоступная предварительная версия Текст в текст
Llama-3.3-70B-Instruct Не поддерживается SFT Общедоступная предварительная версия Текст в текст
gpt-oss-20b Не поддерживается SFT Общедоступная предварительная версия Текст в текст

Или можно точно настроить ранее настраиваемую модель, отформатированную как base-model.ft-{jobid}.

Примечание

Модели с открытым кодом (Ministral-3B, Qwen-32B, Llama-3.3-70B-Instruct, gpt-oss-20b) поддерживаются только в ресурсах Foundry и в новом пользовательском интерфейсе Foundry.

Примечание

Глобальное обучение обеспечивает более доступное обучение на токен, но не предлагает размещение данных. В настоящее время он доступен для ресурсов Foundry в следующих регионах:

  • Восточная Австралия
  • Южная Бразилия
  • Центральная Канада
  • Восточная Канада
  • Восточная часть США
  • Восточная часть США2
  • Центральная Франция
  • Западная Германия
  • Италия Север
  • Восточная Япония (нет поддержки зрения)
  • Центральная Корея
  • Северная часть США
  • Восточная Норвегия
  • Центральная Польша (no 4.1-nano support)
  • Юго-Восточная Азия
  • Северная Африка
  • Южная часть США
  • Южная Индия
  • Центральная Испания
  • Центральная Швеция
  • Западная Швейцария
  • Северная Швейцария
  • Южная Часть Великобритании
  • Западная Европа
  • Западная часть США
  • Западная часть США3

Помощники (предварительная версия)

Для помощников требуется сочетание поддерживаемой модели и поддерживаемого региона. Для некоторых инструментов и возможностей требуются последние модели. Следующие модели доступны в API Помощников, пакете SDK и Foundry. В следующей таблице используется стандартное развертывание. Сведения о доступности подготовленной единицы пропускной способности см. в разделе "Подготовленная пропускная способность". Перечисленные модели и регионы можно использовать как с помощниками версии 1, так и с версией 2. Вы можете использовать модели global Standard , если они поддерживаются в следующих регионах.

Регионе gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, turbo-2024-04-09 gpt-4-32k, 0613 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613
австралия - - - - -
eastus - - - -
eastus2 - - - -
francecentral - - - - - -
japaneast - - - - - - - - -
норвегия - - - - - - - - - - -
southindia - - - - - - - - -
Швецияcentral - -
uksouth - - - - - -
westus - - - - -
westus3 - - - - - -

Прекращение использования модели

Последние сведения о выходе на пенсию модели см. в руководстве по выходу на пенсию модели.

Модели Black Forest Labs, проданные непосредственно Azure

Модели FluX Black Forest Labs (BFL) позволяют создавать изображения с отслеживанием состояния изображения в Microsoft Foundry, что позволяет создавать и редактировать высококачественные изображения из текстовых запросов и эталонных изображений. Модели FLUX поддерживают ряд возможностей, включая создание текста к изображению, редактирование много ссылочного изображения, а также создание и редактирование в контексте.

Эти модели можно запускать с помощью API поставщика услуг BFL, а также с помощью образов, поколений и образов и редактирования конечных точек.

Сведения о работе с моделями FLUX в Foundry см. в статье Deploy и использование моделей FLUX в Microsoft Foundry.

Модели Тип и конечная точка API Возможности Тип развертывания (доступность региона)
FLUX.2-flex
Предварительный просмотр
Создание образа
- API поставщика услуг BFL: <resource-name>/providers/blackforestlabs/v1/flux-2-flex
- Входные данные: текст и изображение (32 000 маркеров и до 10 изображенийi)
- Выход: Один образ
- Вызов инструмента: Нет
- Форматы ответов: Изображение (PNG и JPG)
- Ключевые функции: Точное управление; Поддержка нескольких ссылок для до 10 образов
- Дополнительные параметры:
guidance: определяет, насколько тесно выходные данные соответствуют запросу. Минимум: 1.5, максимум: 10, по умолчанию: 4.5. Выше = более тесное соблюдение запроса.
steps: количество шагов вывода. Максимум: 50, по умолчанию: 50. Выше = более подробная, медленнее.
— глобальный стандарт (все регионы)
FLUX.2-pro
Предварительный просмотр
Создание образа
- API поставщика услуг BFL: <resource-name>/providers/blackforestlabs/v1/flux-2-pro
- Входные данные: текст и изображение (32 000 маркеров и до 8 изображенийii)
- Выход: Один образ
- Вызов инструмента: Нет
- Форматы ответов: Изображение (PNG и JPG)
- Ключевые функции: Поддержка нескольких ссылок для до 8 образов; более обоснованным в реальных знаниях; большую гибкость выходных данных; улучшенная производительность
- Дополнительные параметры:(Только ДЛЯ API для конкретного поставщика) Поддерживает все параметры.
— глобальный стандарт (все регионы)
FLUX.1-Kontext-pro
Предварительный просмотр
Создание образа
- API изображений: https://<resource-name>/openai/deployments/{deployment-id}/images/generations
И
https://<resource-name>/openai/deployments/{deployment-id}/images/edits

- API поставщика услуг BFL: <resource-name>/providers/blackforestlabs/v1/flux-kontext-pro?api-version=preview
- Входные данные: текст и изображение (5000 маркеров и 1 изображение)
- Выход: Один образ
- Вызов инструмента: Нет
- Форматы ответов: Изображение (PNG и JPG)
- Ключевые функции: Согласованность символов, расширенное редактирование
- Дополнительные параметры:(Только api для конкретного поставщика)seed, aspect ratio, , input_image, prompt_unsampling, safety_toleranceoutput_format
— глобальный стандарт (все регионы)
FLUX-1.1-pro
Предварительный просмотр
Создание образа
- API изображений: https://<resource-name>/openai/deployments/{deployment-id}/images/generations

- API поставщика услуг BFL: <resource-name>/providers/blackforestlabs/v1/flux-pro-1.1?api-version=preview
- Входные данные: текст (5000 маркеров и 1 изображение)
- Выход: Один образ
- Вызов инструмента: Нет
- Форматы ответов: Изображение (PNG и JPG)
- Ключевые функции: Быстрая скорость вывода, строгое соблюдение запросов, конкурентное ценообразование, масштабируемое поколение
- Дополнительные параметры:(Только api для конкретного поставщика)width, height, , prompt_unsampling, seed, safety_toleranceoutput_format
— глобальный стандарт (все регионы)

i,ii Поддержка нескольких эталонных образов доступна для FLUX.2 [pro] (предварительная версия) и FLUX.2 [flex] (предварительная версия) с помощью API, но не на игровой площадке.

Cohere модели, проданные непосредственно Azure

Семейство моделей Cohere включает различные модели, оптимизированные для различных вариантов использования, включая завершение чата, повторную классификацию и классификацию текста и внедрение. Модели Cohere оптимизированы для различных вариантов использования, включающих причины, сводку и ответы на вопросы.

Модели Тип Возможности Тип развертывания (доступность региона)
Cohere-rerank-v4.0-pro классификация текста (повторная версия) - Входные данные: текст
- Выходные данные: текст
- Языки:en, frdeitpt-brviarjazh-cnes, , ruidhinl
- Вызов инструмента: Нет
- Форматы ответов: JSON
— глобальный стандарт (все регионы)
— Управляемые вычисления
Cohere-rerank-v4.0-fast классификация текста (повторная версия) - Входные данные: текст
- Выходные данные: текст
- Языки:en, frdeitpt-brviarjazh-cnes, , ruidhinl
- Вызов инструмента: Нет
- Форматы ответов: JSON
— глобальный стандарт (все регионы)
— Управляемые вычисления
Cohere-command-a завершение чата - Входные данные: текст (131 072 токенов)
- Выходные данные: текст (8 182 токенов)
- Языки:en, frpt-bresdejait, и zh-cnkoar
- Вызов инструмента: Да
- Форматы ответов: Текст, JSON
— глобальный стандарт (все регионы)
embed-v-4-0 внедрение - Входные данные: текст (512 токенов) и изображения (2MM пикселей)
- Выход: Вектор (256, 512, 1024, 1536 dim.)
- Языки:en, frpt-bresdejait, и zh-cnkoar
— глобальный стандарт (все регионы)

Модели DeepSeek, проданные непосредственно Azure

Семейство моделей DeepSeek включает в себя несколько моделей причин, которые выделялись при пошаговом обучении задач, используя пошаговый процесс обучения, например язык, научное обоснование и задачи программирования.

Модели Тип Возможности Тип развертывания (доступность региона)
DeepSeek-V3.2-Speciale
Предварительный просмотр
завершение чата
(с содержимым причин)
- Входные данные: текст (128 000 токенов)
- Выходные данные: текст (128 000 маркеров)
- Языки:en И zh
- Вызов инструмента: Нет
- Форматы ответов: Текст, JSON
— глобальный стандарт (все регионы)
DeepSeek-V3.2
Предварительный просмотр
завершение чата
(с содержимым причин)
- Входные данные: текст (128 000 токенов)
- Выходные данные: текст (128 000 маркеров)
- Языки:en И zh
- Вызов инструмента: Нет
- Форматы ответов: Текст, JSON
— глобальный стандарт (все регионы)
DeepSeek-V3.1
Предварительный просмотр
завершение чата
(с содержимым причин)
- Входные данные: текст (131 072 токенов)
- Выходные данные: текст (131 072 токенов)
- Языки:en И zh
- Вызов инструмента: Да
- Форматы ответов: Текст, JSON
— глобальный стандарт (все регионы)
DeepSeek-R1-0528
Предварительный просмотр
завершение чата
(с содержимым причин)
- Входные данные: текст (163 840 токенов)
- Выходные данные: текст (163 840 токенов)
- Языки:en И zh
- Вызов инструмента: Нет
- Форматы ответов: Текст
— глобальный стандарт (все регионы)
— глобальные подготовленные (все регионы)
DeepSeek-V3-0324
Предварительный просмотр
завершение чата - Входные данные: текст (131 072 токенов)
- Выходные данные: текст (131 072 токенов)
- Языки:en И zh
- Вызов инструмента: Да
- Форматы ответов: Текст, JSON
— глобальный стандарт (все регионы)
— глобальные подготовленные (все регионы)
DeepSeek-R1 завершение чата
(с содержимым причин)
- Входные данные: текст (163 840 токенов)
- Выходные данные: текст (163 840 токенов)
- Языки:en И zh
- Вызов инструмента: Нет
- Форматы ответов: Текст
— глобальный стандарт (все регионы)
— глобальные подготовленные (все регионы)

Метамодели, проданные непосредственно Azure

Мета-Лама модели и инструменты — это коллекция предварительно обученных и точно настроенных моделей создания текста ИИ и моделей создания изображений. Диапазон метаданных моделей в масштабе для включения:

  • Небольшие языковые модели (SLM), такие как 1B и 3B Base и инструктируют модели для вывода на устройстве и пограничных выводах
  • Модели языка среднего размера (LLMs), такие как 7B, 8B и 70B Base и Instruct models
  • Высокопроизводительные модели, такие как Meta Llama 3.1-405B, инструктируют для создания искусственных данных и вариантов использования дистилляции.
Модели Тип Возможности Тип развертывания (доступность региона)
Llama-4-Maverick-17B-128E-Instruct-FP8
Предварительный просмотр
завершение чата - Входные данные: текст и изображения (маркеры 1M)
- Выходные данные: текст (маркеры 1M)
- Языки:ar, enidptitesdehifr, и tlthvi
- Вызов инструмента: Нет
- Форматы ответов: Текст
— глобальный стандарт (все регионы)
Llama-3.3-70B-Instruct
Предварительный просмотр
завершение чата - Входные данные: текст (128 000 токенов)
- Выходные данные: текст (8 192 токенов)
- Языки:en, , de, itfrpt, hi, и esth
- Вызов инструмента: Нет
- Форматы ответов: Текст
— глобальный стандарт (все регионы)
— глобальные подготовленные (все регионы)

Некоторые метамодели также доступны от партнеров и сообщества.

Microsoft модели, проданные непосредственно Azure

Microsoft модели включают различные группы моделей, такие как маршрутизатор моделей, модели MAI, модели Phi, модели и многое другое. Также доступны несколько моделей Microsoft from партнеров и сообщества.

Сведения о работе с моделями создания MAI-Image-2e и MAI-Image-2 создания текста в Foundry см. в статье Deploy и использование моделей MAI в Microsoft Foundry.

Модели Тип Возможности Тип развертывания (доступность региона)
MAI-Image-2e
Предварительный просмотр
Текст к изображению. Дополнительные сведения см. в конечной точке API . - Входные данные: текст
- Выход: Один образ
- Длина контекста: 32 000 токенов
- Вызов инструмента: Нет
- Форматы ответов: Изображение (PNG)
- Языки:en
- Ключевые функции: Высококачественное создание текста в изображение; синтез фотореалистических изображений с согласованной визуальной структурой; хорошо подходит для изображений продуктов, маркетинговых визуальных элементов, активов бренда и коммерческих творческих рабочих процессов.
- Параметры:width, , heightprompt
Минимальное значение 768×768 пикселей; максимальное количество пикселей 1 048 576 (эквивалентно 1024×1024). Любое измерение может превышать 1024, пока общее число пикселей остается в пределах предела (например, 768×1365).
- Глобальный стандарт (западная часть США, восточная часть США, западная часть США, Западная Европа, Центральная Швеция, Южная Индия)
MAI-Image-2
Предварительный просмотр
Текст к изображению. Дополнительные сведения см. в конечной точке API . - Входные данные: текст
- Выход: Один образ
- Длина контекста: 32 000 токенов
- Вызов инструмента: Нет
- Форматы ответов: Изображение (PNG)
- Языки:en
- Ключевые функции: Высококачественное создание текста в изображение; синтез фотореалистических изображений с согласованной визуальной структурой; хорошо подходит для изображений продуктов, маркетинговых визуальных элементов, активов бренда и коммерческих творческих рабочих процессов.
- Параметры:width, , heightprompt
Минимальное значение 768×768 пикселей; максимальное количество пикселей 1 048 576 (эквивалентно 1024×1024). Любое измерение может превышать 1024, пока общее число пикселей остается в пределах предела (например, 768×1365).
- Глобальный стандарт (западная часть США, восточная часть США, западная часть США, Западная Европа, Центральная Швеция, Южная Индия)
model-router 1 завершение чата Дополнительные сведения см. в обзоре маршрутизатора модели.
- Входные данные: текст, изображение
- Выходные данные: текст (максимальное число выходных маркеров зависитот 2)
Окно контекста: 200 0003
- Языки:en
- Глобальный стандарт (восточная часть США 2, Центральная Швеция)
— Зона данных стандарта4 (восточная часть США 2, Центральная Швеция)

1 Версия 2025-11-18маршрутизатора модели. Более ранние версии (2025-08-07 и 2025-05-19) также доступны.

2Максимальное значение выходных маркеров зависит от базовых моделей в маршрутизаторе модели. Например, 32 768 (), 100 000 (GPT-4.1 series), 128 000 (o4-minigpt-5 reasoning models) и 16 384 (gpt-5-chat).

3 Более крупные контекстные окна совместимы с некоторыми базовыми моделями маршрутизатора модели. Это означает, что вызов API с большим контекстом завершается успешно, только если запрос перенаправляется в одну из таких моделей. В противном случае вызов завершается ошибкой.

4 Выставление счетов за развертывание маршрутизаторов модели "Стандартный" для зоны данных начинается не раньше 1 ноября 2025 г.

Мистральные модели, проданные непосредственно Azure

Модели Тип Возможности Тип развертывания (доступность региона)
mistral-document-ai-2512 Изображение к тексту - Входные данные: изображения или PDF-страницы (30 страниц, максимум 30 МБ PDF-файла)
- Выходные данные: текст
- Языки:en
- Вызов инструмента: нет
- Форматы ответов: Текст, JSON, Markdown
— глобальный стандарт (все регионы)
— стандарт зоны данных (США и ЕС)
mistral-document-ai-2505
Предварительный просмотр
Изображение к тексту - Входные данные: изображения или PDF-страницы (30 страниц, максимум 30 МБ PDF-файла)
- Выходные данные: текст
- Языки:en
- Вызов инструмента: нет
- Форматы ответов: Текст, JSON, Markdown
— глобальный стандарт (все регионы)
— стандарт зоны данных (США и ЕС)
Mistral-Large-3
Предварительный просмотр
завершение чата - Входные данные: текст, изображение
- Выходные данные: текст
- Языки:en, frptnlzhesitde, и jakoar
- Вызов инструмента: Да
- Форматы ответов: Текст, JSON
— глобальный стандарт (все регионы)
— стандарт зоны данных (США и ЕС)

Несколько Мистральных моделей также доступны от партнеров и сообщества.

Модели ИИ Moonshot, проданные непосредственно Azure

Модели ИИ Moonshot включают Кими K2.5 (предварительная версия), модель многомодальной причины, которая принимает ввод текста и изображения.

Модели Тип Возможности Тип развертывания (доступность региона)
Kimi-K2.5
Предварительный просмотр
завершение чата
(с содержимым причин)
- Входные данные: текст и изображение (262 144 токенов)
- Выходные данные: текст (262 144 токена)
- Языки:en И zh
- Вызов инструмента: Да
- Форматы ответов: Текст
— глобальный стандарт (все регионы)

См . эту коллекцию моделей на портале Foundry.

Модели xAI, проданные непосредственно Azure

Модели Grok xAI в Foundry Models включают разнообразный набор моделей причин и неразумных причин, предназначенных для корпоративных вариантов использования, таких как извлечение данных, кодирование, сводка текста и агентические приложения.

Регистрация требуется для доступа кgrok-code-fast-1 (предварительная версия) и grok-4.

Модели Тип Возможности Тип развертывания (доступность региона)
grok-4-20-reasoning
Предварительный просмотр
завершение чата - Входные данные: текст (262 000 токенов)
- Выходные данные: текст (8 192 токенов)
- Языки:en
- Вызов инструмента: да
- Форматы ответов: текст
— глобальный стандарт (все регионы)
grok-4-20-non-reasoning
Предварительный просмотр
завершение чата - Входные данные: текст (262 000 токенов)
- Выходные данные: текст (8 192 токенов)
- Языки:en
- Вызов инструмента: да
- Форматы ответов: текст
— глобальный стандарт (все регионы)
grok-4.1-fast-reasoning
Предварительный просмотр
завершение чата - Входные данные: текст, изображение (128 000 токенов)
- Выходные данные: текст (128 000 маркеров)
- Языки:en
- Вызов инструмента: да
- Форматы ответов: текст
— глобальный стандарт (все регионы)
grok-4.1-fast-non-reasoning
Предварительный просмотр
завершение чата - Входные данные: текст, изображение (128 000 токенов)
- Выходные данные: текст (128 000 маркеров)
- Языки:en
- Вызов инструмента: да
- Форматы ответов: текст
— глобальный стандарт (все регионы)
grok-4 завершение чата - Входные данные: текст (262 000 токенов)
- Выходные данные: текст (8 192 токенов)
- Языки:en
- Вызов инструмента: да
- Форматы ответов: текст
— глобальный стандарт (все регионы)
grok-code-fast-1
Предварительный просмотр
завершение чата - Входные данные: текст (256 000 маркеров)
- Выходные данные: текст (8 192 токенов)
- Языки:en
- Вызов инструмента: да
- Форматы ответов: текст
— глобальный стандарт (все регионы)

Доступность региона модели по типу развертывания

Модели Foundry позволяют выбрать структуру размещения, которая соответствует вашим бизнес-шаблонам и шаблонам использования. Служба предлагает два основных типа развертывания:

  • Стандарт: имеет глобальный вариант развертывания, маршрутизация трафика глобально для обеспечения более высокой пропускной способности.
  • Provisioned: также имеет глобальный вариант развертывания, позволяющий приобрести и развернуть подготовленные единицы пропускной способности в Azure глобальной инфраструктуре.

Все развертывания выполняют одни и те же операции вывода, но выставление счетов, масштабирование и производительность отличаются. Дополнительные сведения о типах развертывания см. в разделе "Типы развертывания" в модели Foundry.

Доступность глобальной модели уровня "Стандартный"

Регионе FLUX.2-flex FLUX.2-pro FLUX.1-Kontext-pro FLUX-1.1-pro Cohere-rerank-v4.0-pro Cohere-rerank-v4.0-fast cohere-command-a embed-v-4-0 DeepSeek-V3.2-Speciale DeepSeek-V3.2 DeepSeek-V3.1 DeepSeek-R1-0528 DeepSeek-V3-0324 DeepSeek-R1 Лама-4-Maverick-17B-128E-Instruct-FP8 Лама-3.3-70B-Instruct MAI-Image-2 маршрутизатор модели mistral-document-ai-2512 mistral-document-ai-2505 Мистраль-Большой-3 Кими-K2.5 grok-4-1-fast-reasoning grok-4-1-fast-non-reasoning grok-4-fast-reasoning grok-4-fast-non-reasoning grok-3 grok-3-mini
австралия - -
бразилия - -
canadacentral - -
canadaeast - -
centralus - -
eastus -
eastus2 -
francecentral - -
germanywestcentral - -
италиянорт - -
japaneast - -
japanwest - -
koreacentral - -
northcentralus - -
норвегия - -
польшацентральная - -
southafricanorth - -
southcentralus - -
southindia -
spaincentral - -
Швецияcentral
швейцариянорт - -
швейцария - -
оаэнорт - -
uksouth - -
westcentralus -
westeurope -
westus -
westus2 - -
westus3 - -