Модели Foundry, предлагаемые Azure

Модели Microsoft Foundry в каталоге моделей включают две основные категории, а именно модели Foundry, продаваемые через Azure и модели Foundry от партнеров и сообщества. В этой статье перечислены некоторые модели Foundry, предлагаемые Azure, а также их возможности, типы развертывания и доступные регионы, не включая устаревшие и выведенные из эксплуатации модели. Модели Foundry, продаваемые Azure, также называются Direct from Azure Models или Azure Direct Models.

Модели, проданные Azure, также размещаются Azure и управляются Azure в рамках службы Foundry Models. Они включают все Azure модели OpenAI и определенные, выбранные модели из лучших поставщиков. Эти модели оплачиваются через вашу подписку на Azure, покрываются условиями соглашений об уровне обслуживания Azure и поддерживаются Microsoft. Список моделей Foundry, поддерживаемых службой агентов Foundry, см. в разделе " Модели, поддерживаемые службой агента", а также список моделей Foundry от партнеров, см. в разделе "Модели Foundry" от партнеров и сообщества.

Совет

Используйте вкладки в верхней части этой страницы, чтобы переключаться между моделями Azure OpenAI и Other model collections от поставщиков, таких как Cohere, DeepSeek, Meta, Mistral AI и xAI.

Azure OpenAI в моделях Microsoft Foundry

Azure OpenAI работает с различным набором моделей с разными возможностями и ценовыми точками. Доступность модели зависит от региона и облака.

Основные моменты модели

Модели Описание
GPT-chat-latest (предварительная версия) НОВЫЕ ФУНКЦИИgpt-chat-latestПредварительный просмотр
Серия GPT-5.5 Новые функцииgpt-5.5
Серия GPT-5.4 gpt-5.4-mini, gpt-5.4-nano, gpt-5.4, gpt-5.4-pro
Серия GPT-5.3 gpt-5.3-chat, gpt-5.3-codex
Серия GPT-5.2 gpt-5.2-codex, , gpt-5.2gpt-5.2-chatпредварительная версия
Серия GPT-5.1 gpt-5.1, gpt-5.1-chatпредварительная версия, , gpt-5.1-codexgpt-5.1-codex-mini
Сора НОВАЯ сора-2
Серия GPT-5 gpt-5, , gpt-5-mini, gpt-5-nanogpt-5-chatпредварительная версия
gpt-oss Модели рассуждений с открытыми весами
codex-mini Точно настроенная версия o4-mini.
Серия GPT-4.1 gpt-4.1, gpt-4.1-mini, gpt-4.1-nano
предварительный просмотр использования компьютера Экспериментальная модель, обученная для использования инструмента работы с компьютером API Responses.
модели o-серии Модели рассуждений с расширенным решением проблем и повышением фокуса и возможностей.
GPT-4o, GPT-4o mini и GPT-4 Turbo Возможности моделей Azure OpenAI с многомодальными версиями, которые могут принимать как текст, так и изображения в качестве входных данных.
Внедрение Набор моделей, которые могут преобразовать текст в числовую векторную форму для облегчения поиска схожести текстов.
Создание образа Серия моделей, которые могут создавать исходные изображения на естественном языке.
Video generation Модель, которая может создавать исходные видео-сцены из текстовых инструкций.
Аудио Серия моделей для преобразования речи в текст, перевод и текст в речь. Звуковые модели GPT-4o поддерживают либо диалоговые взаимодействия с использованием как входящей, так и исходящей речи с низкой задержкой, либо создание аудио.

новый чат GPT

Сведения о доступности модели во всех регионах, сгруппированных по категории развертывания, см. в разделе Регион доступности для моделей Foundry, проданных Azure.

Возможности

Идентификатор модели Описание Окно контекста Максимальное количество выходных маркеров Учебные данные (до определенного объема)
gpt-chat-latest (2026-05-05)
Предварительный просмотр
- Рассуждения
— API завершения чата.
- API ответов.
— структурированные выходные данные
— Функции, инструменты и параллельные вызовы инструментов.
128,000

Входные данные: 111 616
Выходные данные: 16,384
16,384 Август 2025 г.

Примечание

Вы также можете увидеть эту модель, называемую OpenAI как GPT-5.5 Instant или в API OpenAI как chat-latest. В Microsoft Foundry мы представляем gpt-chat-latest в качестве имени продукта для этого выпуска. Модель продолжает следовать существующему жизненному циклу предварительной версии и стандартным периодам уведомления. Мы также оцениваем способы упрощения доступа клиентов к постоянно обновляемым моделям с течением времени, но текущее поведение остается неизменным, так как эта работа продолжается.

GPT-5.5

Сведения о доступности модели во всех регионах, сгруппированных по категории развертывания, см. в разделе Регион доступности для моделей Foundry, проданных Azure.

Возможности

Идентификатор модели Описание Окно контекста Максимальное количество выходных маркеров Учебные данные (до определенного объема)
gpt-5.5 (2026-04-24) - Рассуждения
- API ответов.
— API завершения чата.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции, инструменты и параллельные вызовы инструментов.
- Использование компьютера
- Полная сводка возможностей.
1050 000 br>
Входные данные: 922 000
Выходные данные: 128 000
128,000 Декабрь 2025 г.

Примечание

Для развертывания этой модели для некоторых уровней квот потребуется запрашивать квоты gpt-5.5 . По умолчанию подписки уровня 5 и 6 имеют квоту.

GPT-5.4

Сведения о доступности модели во всех регионах, сгруппированных по категории развертывания, см. в разделе Регион доступности для моделей Foundry, проданных Azure.

Возможности

Идентификатор модели Описание Окно контекста Максимальное количество выходных маркеров Учебные данные (до определенного объема)
gpt-5.4 (2026-03-05) - Рассуждения
- API ответов.
— API завершения чата.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции, инструменты и параллельные вызовы инструментов.
- Использование компьютера
- Полная сводка возможностей.
1,050,000 128,000 Август 2025 г.
gpt-5.4-pro (2026-03-05) - Рассуждения
- API ответов.
— Обработка текста и изображения.
— Функции и инструменты
- Полная сводка возможностей.
1,050,000 128,000 Август 2025 г.
gpt-5.4-mini (2026-03-17) - Рассуждения
- API ответов.
— API завершения чата.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции, инструменты и параллельные вызовы инструментов.
- Использование компьютера
- Полная сводка возможностей.
400,000

Входные данные: 272 000
Выходные данные: 128 000
128,000 Август 2025 г.
gpt-5.4-nano (2026-03-17) - Рассуждения
- API ответов.
— API завершения чата.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции, инструменты и параллельные вызовы инструментов.
- Полная сводка возможностей.
400,000

Входные данные: 272 000
Выходные данные: 128 000
128,000 Август 2025 г.

GPT-5.3

Сведения о доступности модели во всех регионах, сгруппированных по категории развертывания, см. в разделе Регион доступности для моделей Foundry, проданных Azure.

Возможности

Идентификатор модели Описание Окно контекста Максимальное количество выходных маркеров Учебные данные (до определенного объема)
gpt-5.3-codex (2026-02-24) - Рассуждения
- API ответов.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции, инструменты и параллельные вызовы инструментов.
- Полная сводка возможностей.
— Оптимизировано для расширения Codex CLI и Codex VS Code
400,000

Входные данные: 272 000
Выходные данные: 128 000
128,000 Август 2025 г.
gpt-5.3-chat (2026-03-03)
Предварительный просмотр
— API завершения чата.
- API ответов.
— структурированные выходные данные
— Функции, инструменты и параллельные вызовы инструментов.
128,000

Входные данные: 111 616
Выходные данные: 16,384
16,384 Август 2025 г.

GPT-5.2

Сведения о доступности модели во всех регионах, сгруппированных по категории развертывания, см. в разделе Регион доступности для моделей Foundry, проданных Azure.

Возможности

Идентификатор модели Описание Окно контекста Максимальное количество выходных маркеров Учебные данные (до определенного объема)
gpt-5.2-codex (2026-01-14) - Рассуждения
- API ответов.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции, инструменты и параллельные вызовы инструментов.
- Полная сводка возможностей.
— Оптимизировано для расширения Codex CLI и Codex VS Code
400,000

Входные данные: 272 000
Выходные данные: 128 000
128,000
gpt-5.2 (2025-12-11) - Рассуждения
— API завершения чата.
- API ответов.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции, инструменты и параллельные вызовы инструментов.
- Полная сводка возможностей.
400,000

Входные данные: 272 000
Выходные данные: 128 000
128,000 Август 2025 г.
gpt-5.2-chat (2025-12-11)
Предварительный просмотр
— API завершения чата.
- API ответов.
— структурированные выходные данные
— Функции, инструменты и параллельные вызовы инструментов.
128,000

Входные данные: 111 616
Выходные данные: 16,384
16,384 Август 2025 г.
gpt-5.2-chat (2026-02-10)
Предварительный просмотр
— API завершения чата.
- API ответов.
— структурированные выходные данные
— Функции, инструменты и параллельные вызовы инструментов.
128,000

Входные данные: 111 616
Выходные данные: 16,384
16,384 Август 2025 г.

Осторожно

Мы не рекомендуем использовать предварительные версии моделей в рабочей среде. Мы обновим все развертывания моделей предварительного просмотра до будущих версий предварительного просмотра или до последней стабильной общедоступной версии. Модели, назначенные предварительной версией, не соответствуют стандартному жизненному циклу модели OpenAI Azure.

GPT-5.1

Сведения о доступности модели во всех регионах, сгруппированных по категории развертывания, см. в разделе Регион доступности для моделей Foundry, проданных Azure.

Возможности

Идентификатор модели Описание Окно контекста Максимальное количество выходных маркеров Учебные данные (до определенного объема)
gpt-5.1 (2025-11-13) - Рассуждения
— API завершения чата.
- API ответов.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции, инструменты и параллельные вызовы инструментов.
- Полная сводка возможностей.
400,000

Входные данные: 272 000
Выходные данные: 128 000
128,000 30 сентября 2024 г.
gpt-5.1-chat (2025-11-13)
Предварительный просмотр
- Рассуждения
— API завершения чата.
- API ответов.
— структурированные выходные данные
— Функции, инструменты и параллельные вызовы инструментов.
128,000

Входные данные: 111 616
Выходные данные: 16,384
16,384 30 сентября 2024 г.
gpt-5.1-codex (2025-11-13) - Только API ответов .
— Обработка текста и изображений
— структурированные выходные данные.
— Функции, инструменты и параллельные вызовы инструментов.
- Полная сводка возможностей
— Оптимизировано для расширения Codex CLI и Codex VS Code
400,000

Входные данные: 272 000
Выходные данные: 128 000
128,000 30 сентября 2024 г.
gpt-5.1-codex-mini (2025-11-13) - Только API ответов .
— Обработка текста и изображений
— структурированные выходные данные.
— Функции, инструменты и параллельные вызовы инструментов.
- Полная сводка возможностей
— Оптимизировано для расширения Codex CLI и Codex VS Code
400,000

Входные данные: 272 000
Выходные данные: 128 000
128,000 30 сентября 2024 г.
gpt-5.1-codex-max (2025-12-04) - Только API ответов .
— Обработка текста и изображений
— структурированные выходные данные.
— Функции, инструменты и параллельные вызовы инструментов.
- Полная сводка возможностей
— Оптимизировано для расширения Codex CLI и Codex VS Code
400,000

Входные данные: 272 000
Выходные данные: 128 000
128,000 30 сентября 2024 г.

Осторожно

Мы не рекомендуем использовать предварительные версии моделей в рабочей среде. Мы обновим все развертывания моделей предварительного просмотра до будущих версий предварительного просмотра или до последней стабильной общедоступной версии. Модели, назначенные предварительной версией, не соответствуют стандартному жизненному циклу модели OpenAI Azure.

Важно

  • gpt-5.1 reasoning_effort значение по умолчанию none. При обновлении предыдущих моделей gpt-5.1 логики следует помнить, что может потребоваться обновить код, чтобы явно передать reasoning_effort уровень, если требуется задействовать логику.

  • gpt-5.1-chat добавляет встроенные возможности рассуждений. Как и другие модели причин , они не поддерживают такие параметры temperature. При обновлении использования gpt-5-chat (которая не является моделью рассуждений) на gpt-5.1-chat, убедитесь, что удаляете любые пользовательские параметры, такие как temperature, из кода, которые не поддерживаются моделями рассуждений.

  • gpt-5.1-codex-max добавляет поддержку для настройки reasoning_effort на xhigh. Усилия по аргументации none не поддерживаются gpt-5.1-codex-max.

GPT-5

Сведения о доступности модели во всех регионах, сгруппированных по категории развертывания, см. в разделе Регион доступности для моделей Foundry, проданных Azure.

Возможности

Идентификатор модели Описание Окно контекста Максимальное количество выходных маркеров Учебные данные (до определенного объема)
gpt-5 (2025-08-07) - Рассуждения
— API завершения чата.
- API ответов.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции, инструменты и параллельные вызовы инструментов.
- Полная сводка возможностей.
400,000

Входные данные: 272 000
Выходные данные: 128 000
128,000 30 сентября 2024 г.
gpt-5-mini (2025-08-07) - Рассуждения
— API завершения чата.
- API ответов.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции, инструменты и параллельные вызовы инструментов.
- Полная сводка возможностей.
400,000

Входные данные: 272 000
Выходные данные: 128 000
128,000 31 мая 2024 г.
gpt-5-nano (2025-08-07) - Рассуждения
— API завершения чата.
- API ответов.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции, инструменты и параллельные вызовы инструментов.
- Полная сводка возможностей.
400,000

Входные данные: 272 000
Выходные данные: 128 000
128,000 31 мая 2024 г.
gpt-5-chat (2025-08-07)
Предварительный просмотр
— API завершения чата.
- API ответов.
- Входные данные: текст и изображение
- Выходные данные: только текст
128,000 16,384 30 сентября 2024 г.
gpt-5-chat (2025-10-03)
Предварительная версия1
— API завершения чата.
- API ответов.
- Входные данные: текст и изображение
- Выходные данные: только текст
128,000 16,384 30 сентября 2024 г.
gpt-5-codex (2025-09-11) - Только API ответов .
- Входные данные: текст и изображение
- Выходные данные: только текст
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции, инструменты и параллельные вызовы инструментов.
- Полная сводка возможностей
— Оптимизировано для расширения Codex CLI и Codex VS Code
400,000

Входные данные: 272 000
Выходные данные: 128 000
128,000 -
gpt-5-pro (2025-10-06) - Рассуждения
- API ответов.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции и инструменты
- Полная сводка возможностей.
400,000

Входные данные: 272 000
Выходные данные: 128 000
128,000 30 сентября 2024 г.

Примечание

1gpt-5-chat версия 2025-10-03 представляет значительное улучшение, ориентированное на эмоциональный интеллект и возможности психического здоровья. Это обновление интегрирует специализированные наборы данных и усовершенствованные стратегии реагирования для улучшения способности модели:

  • Узнайте и интерпретируйте эмоциональный контекст более точно, что позволяет осуществлять более нюансированные и эмпатичные взаимодействия.
  • Предоставление поддерживающих и ответственных ответов в беседах, связанных с психическим здоровьем, с учетом чувствительности и соблюдения лучших практик.

Эти улучшения направлены на то, чтобы сделать GPT-5-чат более осведомленным о контексте, ориентированным на человека и надежным в ситуациях, где критически важны эмоциональный настрой и благополучие.

Осторожно

Мы не рекомендуем использовать предварительные версии моделей в рабочей среде. Мы обновим все развертывания моделей предварительного просмотра до будущих версий предварительного просмотра или до последней стабильной общедоступной версии. Модели, назначенные предварительной версией, не соответствуют стандартному жизненному циклу модели OpenAI Azure.

gpt-oss

Сведения о доступности модели во всех регионах, сгруппированных по категории развертывания, см. в разделе Регион доступности для моделей Foundry, проданных Azure.

Возможности

Идентификатор модели Описание Окно контекста Максимальное количество выходных маркеров Учебные данные (до определенного объема)
gpt-oss-120b 1 (предварительная версия) — только ввод/вывод текста
— API завершения чата
- Потоковая передача
— Вызов функции
— структурированные выходные данные
-Рассуждения
— доступно для развертывания1 и с помощью управляемых вычислений
131,072 131,072 31 мая 2024 г.
gpt-oss-20b (предварительная версия) — только ввод/вывод текста
— API завершения чата
- Потоковая передача
— Вызов функции
— структурированные выходные данные
-Рассуждения
— доступно с помощью управляемых вычислительных ресурсов и Foundry Local
131,072 131,072 31 мая 2024 г.

1 В отличие от других моделей OpenAI Azure gpt-oss-120b требуется проект Foundry для развертывания модели.

Развертывание с помощью кода

az cognitiveservices account deployment create \
  --name "Foundry-project-resource" \
  --resource-group "test-rg" \
  --deployment-name "gpt-oss-120b" \
  --model-name "gpt-oss-120b" \
  --model-version "1" \
  --model-format "OpenAI-OSS" \
  --sku-capacity 10 \
  --sku-name "GlobalStandard"

Серия GPT-4.1

Сведения о доступности модели во всех регионах, сгруппированных по категории развертывания, см. в разделе Регион доступности для моделей Foundry, проданных Azure.

Возможности

Идентификатор модели Описание Окно контекста Максимальное количество выходных токенов Обучающие данные (максимум)
gpt-4.1 (2025-04-14) — ввод текста и изображения
— вывод текста
— API завершения чата
— API ответов
- Потоковая передача
— Вызов функции
— структурированные выходные данные (завершение чата)
- 1,047,576
— 300 000 (стандартные и подготовленные управляемые развертывания)
- 128 000 (пакетные развертывания)
32,768 31 мая 2024 г.
gpt-4.1-nano (2025-04-14) — ввод текста и изображения
— вывод текста
— API завершения чата
— API ответов
- Потоковая передача
— Вызов функции
— структурированные выходные данные (завершение чата)
- 1,047,576
— 300 000 (стандартные и подготовленные управляемые развертывания)
- 128 000 (пакетные развертывания)
32,768 31 мая 2024 г.
gpt-4.1-mini (2025-04-14) — ввод текста и изображения
— вывод текста
— API завершения чата
— API ответов
- Потоковая передача
— Вызов функции
— структурированные выходные данные (завершение чата)
- 1,047,576
— 300 000 (стандартные и подготовленные управляемые развертывания)
- 128 000 (пакетные развертывания)
32,768 31 мая 2024 г.

Известная проблема

Известная проблема влияет на все модели серии GPT 4.1. Определения вызовов инструментов или функций большого размера, которые превышают 300 000 токенов, приводят к сбоям, даже если не достигнут предел контекста в 1 миллион токенов моделей.

Ошибки могут отличаться на основе вызовов API и базовых характеристик полезных данных.

Ниже приведены сообщения об ошибках ДЛЯ API завершения чата:

  • Error code: 400 - {'error': {'message': "This model's maximum context length is 300000 tokens. However, your messages resulted in 350564 tokens (100 in the messages, 350464 in the functions). Please reduce the length of the messages or functions.", 'type': 'invalid_request_error', 'param': 'messages', 'code': 'context_length_exceeded'}}

  • Error code: 400 - {'error': {'message': "Invalid 'tools[0].function.description': string too long. Expected a string with maximum length 1048576, but got a string with length 2778531 instead.", 'type': 'invalid_request_error', 'param': 'tools[0].function.description', 'code': 'string_above_max_length'}}

Ниже приведено сообщение об ошибке ДЛЯ API ответов:

  • Error code: 500 - {'error': {'message': 'The server had an error processing your request. Sorry about that! You can retry your request, or contact us through an Azure support request at: https://go.microsoft.com/fwlink/?linkid=2213926 if you keep seeing this error. (Please include the request ID d2008353-291d-428f-adc1-defb5d9fb109 in your email.)', 'type': 'server_error', 'param': None, 'code': None}}

компьютерная предварительная версия

Экспериментальная модель, обученная для использования с инструментом API ответов в вычислительных системах.

Его можно использовать с сторонними библиотеками, чтобы позволить модели управлять вводом мыши и клавиатуры, а также получать контекст из снимков экрана текущей среды.

Осторожно

Мы не рекомендуем использовать предварительные версии моделей в рабочей среде. Мы обновим все развертывания моделей предварительного просмотра до будущих версий предварительного просмотра или до последней стабильной общедоступной версии. Модели, назначенные предварительной версией, не соответствуют стандартному жизненному циклу модели OpenAI Azure.

Для доступа computer-use-previewтребуется регистрация. Доступ предоставляется на основе критериев соответствия Microsoft. Клиенты, имеющие доступ к другим моделям ограниченного доступа, по-прежнему должны запрашивать доступ к этой модели.

Чтобы запросить доступ, перейдите к приложениюcomputer-use-preview модели ограниченного доступа. После предоставления доступа необходимо создать развертывание для модели.

Сведения о доступности модели во всех регионах, сгруппированных по категории развертывания, см. в разделе Регион доступности для моделей Foundry, проданных Azure.

Возможности

Идентификатор модели Описание Окно контекста Максимальное количество выходных токенов Обучающие данные (максимум)
computer-use-preview (2025-03-11) Специализированная модель для использования с инструментом для работы с компьютером Responses API

-Инструменты
- Стриминг
— Текст (входные и выходные данные)
— изображение (входные данные)
8,192 1,024 Октябрь 2023 г.

модели o-серии

Модели Azure OpenAI o-серии разработаны для решения задач рассуждения и решения проблем с повышенным вниманием и возможностями. Эти модели тратят больше времени на обработку и понимание запроса пользователя, что делает их исключительно сильными в таких областях, как наука, программирование и математика, по сравнению с предыдущими итерациями.

Сведения о доступности модели во всех регионах, сгруппированных по категории развертывания, см. в разделе Регион доступности для моделей Foundry, проданных Azure.

Возможности

Идентификатор модели Описание Максимальное количество токенов в запросе Обучающие данные (максимум)
codex-mini (2025-05-16) Точно настроенная версия o4-mini.
- API ответов.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции и инструменты.
Полная сводка возможностей.
Входные данные: 200 000
Выходные данные: 100 000
31 мая 2024 г.
o3-pro (2025-06-10) - API ответов.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции и инструменты.
Полная сводка возможностей.
Входные данные: 200 000
Выходные данные: 100 000
31 мая 2024 г.
o4-mini (2025-04-16) - Новая модель рассуждений, предлагающая расширенные возможности аргументирования.
— API завершения чата.
- API ответов.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции и инструменты.
Полная сводка возможностей.
Входные данные: 200 000
Выходные данные: 100 000
31 мая 2024 г.
o3 (2025-04-16) - Новая модель рассуждений, предлагающая расширенные возможности аргументирования.
— API завершения чата.
- API ответов.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции, инструменты и параллельные вызовы инструментов.
Полная сводка возможностей.
Входные данные: 200 000
Выходные данные: 100 000
31 мая 2024 г.
o3-mini (2025-01-31) - Расширенные способности рассудка.
— структурированные выходные данные.
Только текстовая обработка.
— Функции и инструменты.
Входные данные: 200 000
Выходные данные: 100 000
Октябрь 2023 г.
o1 (2024-12-17) - Расширенные способности рассудка.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции и инструменты.
Входные данные: 200 000
Выходные данные: 100 000
Октябрь 2023 г.
o1-preview 1 (2024-09-12) Более ранняя предварительная версия. Входные данные: 128 000
Выходные данные: 32 768
Октябрь 2023 г.
o1-mini 2 (2024-09-12) Более быстрый и более экономичный вариант в серии o1 идеально подходит для задач программирования, требующих скорости и снижения потребления ресурсов.
— Глобальное развертывание уровня "Стандартный", доступное по умолчанию.
— Развертывания уровня "Стандартный" (региональные) в настоящее время доступны только для тех клиентов, которые получили доступ в рамках выпуска ограниченного o1-preview доступа.
Входные данные: 128 000
Выходные данные: 65 536
Октябрь 2023 г.

1o1-preview доступна только для клиентов, которым предоставлен доступ в рамках исходного ограниченного доступа.

2o1-mini в настоящее время доступно всем клиентам для развертывания Global Standard. Некоторые клиенты получили стандартный (региональный) доступ к развертыванию o1-mini в рамках ограниченного выпуска o1-preview доступа. В настоящее время доступ к стандартным o1-mini (региональным) развертываниям не расширяется.

В настоящее время o3-deep-research доступен только через службу агента Foundry. Дополнительные сведения см. в руководстве по глубокому исследованию.

Дополнительные сведения о расширенных моделях серии o см. в статье "Начало работы с моделями причин".

GPT-4o и GPT-4 Turbo

GPT-4o интегрирует текст и изображения в одну модель, что позволяет одновременно обрабатывать несколько типов данных. Этот многомодальный подход повышает точность и скорость реагирования на взаимодействие с компьютером. GPT-4o соответствует GPT-4 Turbo в задачах английского текста и программирования, обеспечивая более высокую производительность в задачах, отличных от английского языка, и задачах визуального зрения, устанавливая новые тесты для возможностей искусственного интеллекта.

Сведения о доступности модели во всех регионах, сгруппированных по категории развертывания, см. в разделе Регион доступности для моделей Foundry, проданных Azure.

Модели GPT-4 и GPT-4 Turbo

Эти модели можно использовать только с API завершения чата. См. версии моделей, чтобы узнать, как Azure OpenAI обрабатывает обновления версий моделей. Ознакомьтесь с моделями, чтобы узнать, как просматривать и настраивать параметры версии модели для развертываний GPT-4.

Сведения о доступности модели во всех регионах, сгруппированных по категории развертывания, см. в разделе Регион доступности для моделей Foundry, проданных Azure.

Возможности

Идентификатор модели Описание Максимальное количество токенов в запросе Обучающие данные (максимум)
gpt-4o (2024-11-20)
GPT-4o (Omni)
— структурированные выходные данные.
— Обработка текста и изображения.
— режим JSON.
— параллельный вызов функции.
— улучшенная точность и скорость реагирования.
— Паритетность с английским текстом и задачами программирования по сравнению с GPT-4 Turbo с Vision.
— высокая производительность на языках, отличных от английского языка, и в задачах визуального зрения.
- Улучшенные творческие способности писать.
Входные данные: 128 000
Выходные данные: 16,384
Октябрь 2023 г.
gpt-4o (2024-08-06)
GPT-4o (Omni)
— структурированные выходные данные.
— Обработка текста и изображения.
— режим JSON.
— параллельный вызов функции.
— улучшенная точность и скорость реагирования.
— Паритетность с английским текстом и задачами программирования по сравнению с GPT-4 Turbo с Vision.
— высокая производительность на языках, отличных от английского языка, и в задачах визуального зрения.
Входные данные: 128 000
Выходные данные: 16,384
Октябрь 2023 г.
gpt-4o-mini (2024-07-18)
GPT-4o mini
— Быстрая, недорогая и мощная модель идеально подходит для замены моделей серии GPT-3.5 Turbo.
— Обработка текста и изображения.
— режим JSON.
— параллельный вызов функции.
Входные данные: 128 000
Выходные данные: 16,384
Октябрь 2023 г.
gpt-4o (2024-05-13)
GPT-4o (Omni)
— Обработка текста и изображения.
— режим JSON.
— параллельный вызов функции.
— улучшенная точность и скорость реагирования.
— Паритетность с английским текстом и задачами программирования по сравнению с GPT-4 Turbo с Vision.
— высокая производительность на языках, отличных от английского языка, и в задачах визуального зрения.
Входные данные: 128 000
Вывод: 4 096
Октябрь 2023 г.
gpt-4 1 (turbo-2024-04-09)
GPT-4 Turbo с функцией зрения
Новая общедоступная модель.
— замена всех предыдущих предварительных моделей GPT-4 (vision-preview, 1106-Preview, 0125-Preview).
- Доступность компонентов в настоящее время отличается в зависимости от метода ввода и типа развертывания.
Входные данные: 128 000
Вывод: 4 096
Декабрь 2023 г.

1 Подготовленная версия версии gpt-4turbo-2024-04-09 в настоящее время ограничена только текстом. Дополнительные сведения о подготовленных развертываниях см. в руководстве по подготовке.

Осторожно

Мы не рекомендуем использовать предварительные версии моделей в рабочей среде. Мы обновим все развертывания моделей предварительного просмотра до будущих версий предварительного просмотра или до последней стабильной общедоступной версии. Модели, назначенные предварительной версией, не соответствуют стандартному жизненному циклу модели OpenAI Azure.

Встраивания

text-embedding-3-large является последней и самой способной моделью внедрения. Невозможно обновиться между моделями встраивания. Чтобы перейти с использования text-embedding-ada-002 на использование text-embedding-3-large, необходимо создать новые эмбеддинги.

  • text-embedding-3-large
  • text-embedding-3-small
  • text-embedding-ada-002

Сведения о доступности модели во всех регионах, сгруппированных по категории развертывания, см. в разделе Регион доступности для моделей Foundry, проданных Azure.

Возможности

OpenAI сообщает, что тесты показывают, что модели эмбеддингов большого и малого третьего поколения обеспечивают лучшую среднюю производительность многоязычного извлечения с использованием бенчмарка MIRACL. Они по-прежнему поддерживают производительность для задач на английском языке с использованием теста MTEB.

Эталон оценки text-embedding-ada-002 text-embedding-3-small text-embedding-3-large
Среднее значение MIRACL 31.4 44.0 54.9
Среднее значение MTEB 61.0 62.3 64.6

Модели внедрения третьего поколения поддерживают уменьшение размера внедрения с помощью нового dimensions параметра. Как правило, более крупные внедрения являются более дорогими с точки зрения вычислений, памяти и хранилища. При настройке количества измерений вы получаете больше контроля над общими затратами и производительностью. Параметр dimensions не поддерживается во всех версиях библиотеки openAI 1.x Python. Чтобы воспользоваться этим параметром, рекомендуется обновить до последней версии: pip install openai --upgrade

Тестирование по MTEB в OpenAI показало, что даже если размерности модели третьего поколения text-embeddings-ada-002 уменьшены до менее чем 1536, производительность остается немного лучше.

Эти модели можно использовать только с запросами API внедрения.

Идентификатор модели Максимальное количество токенов в запросе Измерения выходных данных Обучающие данные (максимум)
text-embedding-ada-002 (версия 2) 8,192 1,536 Сентябрь 2021 г.
text-embedding-ada-002 (версия 1) 2,046 1,536 Сентябрь 2021 г.
text-embedding-3-large 8,192 3,072 Сентябрь 2021 г.
text-embedding-3-small 8,192 1,536 Сентябрь 2021 г.

Примечание

При отправке массива входных данных для внедрения максимальное количество входных элементов в массиве на вызов конечной точки внедрения составляет 2048.

Модели создания изображений

Модели создания изображений создают изображения из текстовых запросов, которые предоставляет пользователь. Модели создания изображений включают gpt-image-1, и gpt-image-1-minigpt-image-1.5gpt-image-2.

Сведения о доступности модели во всех регионах, сгруппированных по категории развертывания, см. в разделе Регион доступности для моделей Foundry, проданных Azure.

Идентификатор модели Максимальная длина запроса (символы)
gpt-image-1 4,000
gpt-image-1-mini 4,000
gpt-image-1.5 4,000

Модели создания видео

Sora — это модель ИИ из OpenAI, которая может создавать реалистичные и образные видео сцены из текстовых инструкций. Sora находится в предварительной версии.

Модели создания видео включают sora и sora-2.

Идентификатор модели Максимальный запрос (символы)
Сора 4,000

Сведения о доступности модели во всех регионах, сгруппированных по категории развертывания, см. в разделе Регион доступности для моделей Foundry, проданных Azure.

Звуковые модели

Звуковые модели в Azure OpenAI доступны через API realtime, completions и audio.

Сведения о доступности модели во всех регионах, сгруппированных по категории развертывания, см. в разделе Регион доступности для моделей Foundry, проданных Azure.

Аудиомодели GPT-4o

Звуковые модели GPT-4o являются частью семейства моделей GPT-4o и поддерживают либо взаимодействия с низкой задержкой речь в, речь из, либо аудиогенерацию.

Осторожно

Мы не рекомендуем использовать предварительные версии моделей в рабочей среде. Мы обновим все развертывания моделей предварительного просмотра до будущих версий предварительного просмотра или до последней стабильной общедоступной версии. Модели, назначенные предварительной версией, не соответствуют стандартному жизненному циклу модели OpenAI Azure.

Сведения о максимальных маркерах запроса и обучающих данных доступны в следующей таблице:

Идентификатор модели Описание Максимальное количество токенов в запросе Обучающие данные (максимум)
gpt-4o-mini-audio-preview (2024-12-17)
Предварительный просмотр
Звуковая модель для создания звука и текста. Входные данные: 128 000
Выходные данные: 16,384
Сентябрь 2023 г.
gpt-4o-audio-preview (2024-12-17) Звуковая модель для создания звука и текста. Входные данные: 128 000
Выходные данные: 16,384
Сентябрь 2023 г.
gpt-4o-realtime-preview (2025-06-03) Звуковая модель для обработки звука в режиме реального времени. Входные данные: 32 000
Вывод: 4 096
Октябрь 2023 г.
gpt-4o-realtime-preview (2024-12-17) Звуковая модель для обработки звука в режиме реального времени. Вход: 16 000
Вывод: 4 096
Октябрь 2023 г.
gpt-4o-mini-realtime-preview (2024-12-17)
Предварительный просмотр
Звуковая модель для обработки звука в режиме реального времени. Входные данные: 128 000
Вывод: 4 096
Октябрь 2023 г.
gpt-audio(28.08.2025)
gpt-audio-mini(06.10.2025)
Звуковая модель для создания звука и текста. Входные данные: 128 00
Выходные данные: 16,384
Октябрь 2023 г.
gpt-realtime (2025-08-28) (GA)
gpt-realtime-mini (2025-10-06)
gpt-realtime-mini (2025-12-15)
Звуковая модель для обработки звука в режиме реального времени. Входные данные: 32,00
Вывод: 4 096
Октябрь 2023 г.
gpt-audio-1.5 (2026-02-23) Звуковая модель для создания звука и текста. Входные данные: 128 00
Выходные данные: 16,384
Сентябрь 2024 г.
gpt-realtime-1.5 (2026-02-23) Звуковая модель для обработки звука в режиме реального времени. Входные данные: 32,00
Вывод: 4 096
Сентябрь 2024 г.

API аудио

Звуковые модели с помощью /audio API можно использовать для преобразования речи в текст, перевод и текст в речь.

Модели преобразования речи в текст

Идентификатор модели Описание Максимальный запрос (размер аудиофайла)
whisper Модель распознавания речи общего назначения. 25 МБ
gpt-4o-transcribe (2025-03-20)
Предварительный просмотр
Модель преобразования речи в текст на основе GPT-4o. 25 МБ
gpt-4o-mini-transcribe (2025-03-20)
Предварительный просмотр
Модель преобразования речи в текст с помощью GPT-4o mini. 25 МБ
gpt-4o-transcribe-diarize (2025-10-15)
Предварительный просмотр
Модель преобразования речи в текст с автоматическим распознаванием речи. 25 МБ
gpt-4o-mini-transcribe (2025-12-15)
Предварительный просмотр
Модель преобразования речи в текст с автоматическим распознаванием речи. Улучшена точность транскрибирования и надежность. 25 МБ

Модели перевода речи

Идентификатор модели Описание Максимальный запрос (размер аудиофайла)
whisper Модель распознавания речи общего назначения. 25 МБ

Модели преобразования текста в речь (предварительная версия)

Идентификатор модели Описание
tts
Предварительный просмотр
Модель преобразования текста в речь, оптимизированная для скорости.
tts-hd
Предварительный просмотр
Модель преобразования текста в речь, оптимизированная для качества.
gpt-4o-mini-tts (2025-03-20) Модель преобразования текста в речь с помощью GPT-4o mini.

Вы можете управлять голосом, чтобы говорить в определенном стиле или тоне.
gpt-4o-mini-tts (2025-12-15) Модель преобразования текста в речь с помощью GPT-4o mini.

Вы можете управлять голосом, чтобы говорить в определенном стиле или тоне.

Модели для тонкой настройки

Для точной настройки поддерживаются следующие модели:

Идентификатор модели Стандартные регионы Глобальный Разработчик Методы Статус Модальности
gpt-4o-mini
(2024-07-18)
Северная часть США
Центральная Швеция
SFT GA Текст в текст
gpt-4o
(2024-08-06)
Восточная часть США2
Северная часть США
Центральная Швеция
SFT, DPO GA Текст и распознавание текста из изображений
gpt-4.1
(2025-04-14)
Северная часть США
Центральная Швеция
SFT, DPO GA Текст и распознавание текста из изображений
gpt-4.1-mini
(2025-04-14)
Северная часть США
Центральная Швеция
SFT, DPO GA Текст в текст
gpt-4.1-nano (2025-04-14) Северная часть США
Центральная Швеция
SFT, DPO GA Текст в текст
o4-mini
(2025-04-16)
Восточная часть США2
Центральная Швеция
RFT GA Текст в текст
gpt-5
(2025-08-07)
Северная часть США
Центральная Швеция
RFT Частная предварительная версия Текст в текст
Ministral-3B
(2411)
Не поддерживается SFT Общедоступная предварительная версия Текст в текст
Qwen-32B Не поддерживается SFT Общедоступная предварительная версия Текст в текст
Llama-3.3-70B-Instruct Не поддерживается SFT Общедоступная предварительная версия Текст в текст
gpt-oss-20b Не поддерживается SFT Общедоступная предварительная версия Текст в текст

Или можно доработать ранее настроенную модель, отформатированную как base-model.ft-{jobid}.

Примечание

Модели с открытым кодом (Ministral-3B, Qwen-32B, Llama-3.3-70B-Instruct, gpt-oss-20b) поддерживаются только в ресурсах Foundry и в новом пользовательском интерфейсе Foundry.

Примечание

Глобальное обучение обеспечивает более доступное обучение за токен, но не предусматривает размещение данных. В настоящее время он доступен для ресурсов Foundry в следующих регионах:

  • Восточная Австралия
  • Южная Бразилия
  • Центральная Канада
  • Восточная Канада
  • Восточная часть США
  • Восточная часть США2
  • Центральная Франция
  • Центрально-западная Германия
  • Италия Север
  • Восточная Япония (нет поддержки зрения)
  • Центральная Корея
  • Северная часть США
  • Восточная Норвегия
  • Центральная Польша (поддержка 4.1-nano отсутствует)
  • Юго-Восточная Азия
  • Юг Африки Север
  • Южная часть США
  • Южная Индия
  • Центральная Испания
  • Центральная Швеция
  • Западная Швейцария
  • Северная Швейцария
  • Южная Часть Великобритании
  • Западная Европа
  • Западная часть США
  • Западная часть США3

Помощники (предварительная версия)

Для помощников требуется сочетание поддерживаемой модели и поддерживаемого региона. Для некоторых инструментов и возможностей требуются последние модели. Следующие модели доступны в API Помощников, пакете SDK и Foundry. Таблица ниже предназначена для стандартного развертывания. Сведения о доступности подготовленной единицы пропускной способности см. в разделе "Подготовленные модели пропускной способности". Перечисленные модели и регионы можно использовать как с помощниками версии 1, так и с версией 2. Вы можете использовать модели Global Standard, если они поддерживаются в следующих регионах.

Регион gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4, 0613 gpt-4, 1106-Предварительный просмотр gpt-4, 0125-Предварительная версия gpt-4, turbo-2024-04-09 gpt-4-32k, 0613 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613
австралия восток - - - - -
eastus - - - -
eastus2 - - - -
francecentral - - - - - -
japaneast - - - - - - - - -
Норвегия восток - - - - - - - - - - -
Южная Индия - - - - - - - - -
Швецияcentral - -
uksouth - - - - - -
westus - - - - -
westus3 - - - - - -

Вывод модели из эксплуатации

Последние сведения о выходе на пенсию модели см. в расписании выхода на пенсию модели.

Модели Black Forest Labs, проданные Azure

Модели FLUX от Black Forest Labs (BFL) предоставляют современные технологии генерации изображений в Microsoft Foundry, позволяя вам создавать и редактировать высококачественные изображения, используя текстовые подсказки и референсные изображения. Модели FLUX поддерживают ряд возможностей, включая генерацию изображений из текста, редактирование изображений с использованием нескольких ссылок, а также генерацию и редактирование в контексте.

Эти модели можно запускать с помощью API поставщика услуг BFL, а также через конечные точки images/generations и images/edits.

Чтобы работать с моделями FLUX в Foundry, см. Развертывание и использование моделей FLUX в Microsoft Foundry.

Модель Тип и конечная точка API Возможности Тип развертывания (доступность региона)
FLUX.2-flex
Предварительный просмотр
Создание образа
- API поставщика услуг BFL: <resource-name>/providers/blackforestlabs/v1/flux-2-flex
- Входные данные: текст и изображение (32 000 маркеров и до 10 изображенийi)
- Выход: Один образ
- Вызов инструмента: Нет
- Форматы ответов: Изображение (PNG и JPG)
- Ключевые функции: Точное управление; Поддержка нескольких ссылок для до 10 образов
- Дополнительные параметры:
guidance: определяет, насколько тесно выходные данные соответствуют запросу. Минимум: 1.5, максимум: 10, по умолчанию: 4.5. Выше = более тесное соблюдение запроса.
steps: количество шагов вывода. Максимум: 50, по умолчанию: 50. Выше означает больше деталей, но медленнее.
— глобальный стандарт (все регионы)
FLUX.2-pro
Предварительный просмотр
Создание образа
- API поставщика услуг BFL: <resource-name>/providers/blackforestlabs/v1/flux-2-pro
- Входные данные: текст и изображение (32 000 маркеров и до 8 изображенийii)
- Выход: Один образ
- Вызов инструмента: Нет
- Форматы ответов: Изображение (PNG и JPG)
- Ключевые функции: Поддержка нескольких ссылок для до 8 изображений; более приближенный к реальным знаниям; большая гибкость выходных данных; улучшенная производительность
- Дополнительные параметры:(Только ДЛЯ API для конкретного поставщика) Поддерживает все параметры.
— глобальный стандарт (все регионы)
FLUX.1-Kontext-pro
Предварительный просмотр
Создание образа
- API изображений: https://<resource-name>/openai/deployments/{deployment-id}/images/generations
И
https://<resource-name>/openai/deployments/{deployment-id}/images/edits

- API поставщика услуг BFL: <resource-name>/providers/blackforestlabs/v1/flux-kontext-pro?api-version=preview
- Входные данные: текст и изображение (5000 маркеров и 1 изображение)
- Выход: Один образ
- Вызов инструмента: Нет
- Форматы ответов: Изображение (PNG и JPG)
- Ключевые функции: Согласованность символов, расширенное редактирование
- Дополнительные параметры:(Только api для конкретного поставщика)seed, aspect ratio, , input_image, prompt_unsampling, safety_toleranceoutput_format
— глобальный стандарт (все регионы)
FLUX-1.1-pro
Предварительный просмотр
Создание образа
- API изображений: https://<resource-name>/openai/deployments/{deployment-id}/images/generations

- API поставщика услуг BFL: <resource-name>/providers/blackforestlabs/v1/flux-pro-1.1?api-version=preview
- Входные данные: текст (5000 маркеров и 1 изображение)
- Выход: Один образ
- Вызов инструмента: Нет
- Форматы ответов: Изображение (PNG и JPG)
- Ключевые функции: Быстрая скорость вывода, строгое соблюдение запросов, конкурентное ценообразование, масштабируемое поколение
- Дополнительные параметры:(Только api для конкретного поставщика)width, height, , prompt_unsampling, seed, safety_toleranceoutput_format
— глобальный стандарт (все регионы)

i,ii Поддержка нескольких эталонных образов доступна для FLUX.2 [pro] (предварительная версия) и FLUX.2 [flex] (предварительная версия) с помощью API, но не на игровой площадке.

модели Cohere, доступные в Azure

Семейство моделей Cohere включает различные модели, оптимизированные для различных вариантов использования, включая завершение чата, повторную классификацию и классификацию текста и внедрение. Модели Cohere оптимизированы для различных вариантов использования, включающих причины, сводку и ответы на вопросы.

Модель Тип Возможности Тип развертывания (доступность региона)
Cohere-rerank-v4.0-pro классификация текста (переупорядочение) - Входные данные: текст
- Выходные данные: текст
- Языки:en, fresitdept-brjazh-cnarvi, , hiruidnl
- Вызов инструмента: Нет
- Форматы ответов: JSON
— глобальный стандарт (все регионы)
— Управляемые вычисления
Cohere-rerank-v4.0-fast классификация текста (переупорядочение) - Входные данные: текст
- Выходные данные: текст
- Языки:en, fresitdept-brjazh-cnarvi, , hiruidnl
- Вызов инструмента: Нет
- Форматы ответов: JSON
— глобальный стандарт (все регионы)
— Управляемые вычисления
Cohere-command-a завершение чата - Входные данные: текст (131 072 токенов)
- Выходные данные: текст (8 182 токенов)
- Языки:en, fresitdept-brja, и kozh-cnar
- Вызов инструмента: Да
- Форматы ответов: Текст, JSON
— глобальный стандарт (все регионы)
embed-v-4-0 эмбединги - Входные данные: текст (512 токенов) и изображения (2MM пикселей)
- Выход: Вектор (256, 512, 1024, 1536 dim.)
- Языки:en, fresitdept-brja, и kozh-cnar
— глобальный стандарт (все регионы)

Модели DeepSeek, проданные Azure

Семейство моделей DeepSeek включает в себя несколько моделей рассуждения, которые выделяются в заданиях, требующих пошагового подхода, таких как языковые задачи, научное обоснование и программирование.

Модель Тип Возможности Тип развертывания (доступность региона)
DeepSeek-V4-Pro
Предварительный просмотр
завершение чата
(с контентом аргументации)
- Входные данные: текст (1 000 000 токенов)
- Выходные данные: текст (384 000 токенов)
- Языки:en И zh
- Вызов инструмента: Нет
- Форматы ответов: Текст, JSON
— глобальный стандарт (все регионы)
DeepSeek-V4-Flash
Предварительный просмотр
завершение чата
(с контентом аргументации)
- Входные данные: текст (1 000 000 токенов)
- Выходные данные: текст (384 000 токенов)
- Языки:en И zh
- Вызов инструмента: Нет
- Форматы ответов: Текст, JSON
— глобальный стандарт (все регионы)
DeepSeek-V3.2-Speciale
Предварительный просмотр
завершение чата
(с контентом аргументации)
- Входные данные: текст (128 000 токенов)
- Выходные данные: текст (128 000 маркеров)
- Языки:en И zh
- Вызов инструмента: Нет
- Форматы ответов: Текст, JSON
— глобальный стандарт (все регионы)
DeepSeek-V3.2
Предварительный просмотр
завершение чата
(с контентом аргументации)
- Входные данные: текст (128 000 токенов)
- Выходные данные: текст (128 000 маркеров)
- Языки:en И zh
- Вызов инструмента: Нет
- Форматы ответов: Текст, JSON
— глобальный стандарт (все регионы)
DeepSeek-V3.1
Предварительный просмотр
завершение чата
(с контентом аргументации)
- Входные данные: текст (131 072 токенов)
- Выходные данные: текст (131 072 токенов)
- Языки:en И zh
- Вызов инструмента: Да
- Форматы ответов: Текст, JSON
— глобальный стандарт (все регионы)
DeepSeek-R1-0528
Предварительный просмотр
завершение чата
(с контентом аргументации)
- Входные данные: текст (163 840 токенов)
- Выходные данные: текст (163 840 токенов)
- Языки:en И zh
- Вызов инструмента: Нет
- Форматы ответов: Текст
— глобальный стандарт (все регионы)
— глобально развернутые (все регионы)
DeepSeek-V3-0324
Предварительный просмотр
завершение чата - Входные данные: текст (131 072 токенов)
- Выходные данные: текст (131 072 токенов)
- Языки:en И zh
- Вызов инструмента: Да
- Форматы ответов: Текст, JSON
— глобальный стандарт (все регионы)
— глобально развернутые (все регионы)
DeepSeek-R1 завершение чата
(с контентом аргументации)
- Входные данные: текст (163 840 токенов)
- Выходные данные: текст (163 840 токенов)
- Языки:en И zh
- Вызов инструмента: Нет
- Форматы ответов: Текст
— глобальный стандарт (все регионы)
— глобально развернутые (все регионы)

Метамодели, проданные Azure

Модели и инструменты Meta Llama — это коллекция предварительно обученных и тонко настроенных моделей генеративного ИИ для текстов и моделей логического вывода с изображениями. Диапазон метамоделей масштабируется, чтобы включать:

  • Небольшие языковые модели (SLM), такие как 1B и 3B Base и модели Instruct для инференса на устройствах и периферийных устройствах.
  • Модели языка среднего размера (LLMs), такие как 7B, 8B и 70B Base и Instruct models
  • Высокопроизводительные модели, такие как Meta Llama 3.1-405B, используются для создания синтетических данных и применения в сценариях дистилляции.
Модель Тип Возможности Тип развертывания (доступность региона)
Llama-4-Maverick-17B-128E-Instruct-FP8
Предварительный просмотр
завершение чата - Входные данные: текст и изображения (маркеры 1M)
- Выходные данные: текст (маркеры 1M)
- Языки:ar, enfrdehiiditptes, и tlthvi
- Вызов инструмента: Нет
- Форматы ответов: Текст
— глобальный стандарт (все регионы)
Llama-3.3-70B-Instruct
Предварительный просмотр
завершение чата - Входные данные: текст (128 000 токенов)
- Выходные данные: текст (8 192 токенов)
- Языки:en, , de, fritpt, hi, и esth
- Вызов инструмента: Нет
- Форматы ответов: Текст
— глобальный стандарт (все регионы)
— глобально развернутые (все регионы)

Некоторые метамодели также доступны от партнеров и сообщества.

Модели Microsoft, продаваемые через Azure

Модельный ряд Microsoft включает различные группы, такие как маршрутизатор моделей, модели MAI, модели Phi, модели для здравоохранения AI и другие. Также доступны несколько моделей Microsoft от партнеров и сообщества.

Сведения о работе с моделями преобразования текста в изображение MAI-Image-2e и MAI-Image-2 в Foundry см. в статье Развертывание и использование моделей MAI в Microsoft Foundry.

Модель Тип Возможности Тип развертывания (доступность региона)
MAI-Image-2e
Предварительный просмотр
Текст к изображению. Дополнительные сведения см. в конечной точке API . - Входные данные: текст
- Выход: Один образ
- Длина контекста: 32 000 токенов
- Вызов инструмента: Нет
- Форматы ответов: Изображение (PNG)
- Языки:en
- Ключевые функции: Высококачественное создание текста в изображение; синтез фотореалистических изображений с согласованной визуальной структурой; хорошо подходит для изображений продуктов, маркетинговых визуальных элементов, активов бренда и коммерческих творческих рабочих процессов.
- Параметры:width, , heightprompt
Минимальное значение 768×768 пикселей; максимальное количество пикселей 1 048 576 (эквивалентно 1024×1024). Любое измерение может превышать 1024, пока общее число пикселей остается в пределах предела (например, 768×1365).
- Глобальный стандарт (западная часть США, восточная часть США, западная часть США, Западная Европа, Центральная Швеция, Южная Индия)
MAI-Image-2
Предварительный просмотр
Текст к изображению. Дополнительные сведения см. в конечной точке API . - Входные данные: текст
- Выход: Один образ
- Длина контекста: 32 000 токенов
- Вызов инструмента: Нет
- Форматы ответов: Изображение (PNG)
- Языки:en
- Ключевые функции: Высококачественное создание текста в изображение; синтез фотореалистических изображений с согласованной визуальной структурой; хорошо подходит для изображений продуктов, маркетинговых визуальных элементов, активов бренда и коммерческих творческих рабочих процессов.
- Параметры:width, , heightprompt
Минимальное значение 768×768 пикселей; максимальное количество пикселей 1 048 576 (эквивалентно 1024×1024). Любое измерение может превышать 1024, пока общее число пикселей остается в пределах предела (например, 768×1365).
- Глобальный стандарт (западная часть США, восточная часть США, западная часть США, Западная Европа, Центральная Швеция, Южная Индия)
model-router 1 завершение чата Дополнительные сведения см. в обзоре маршрутизатора модели.
- Входные данные: текст, изображение
- Выходные данные: текст (максимальное количество выходных токенов изменяется до 2)
Окно контекста: 200 0003
- Языки:en
- Глобальный стандарт (восточная часть США 2, Центральная Швеция)
— Зона данных стандарта4 (восточная часть США 2, Центральная Швеция)

1Версия модели маршрутизатора2025-11-18. Более ранние версии (2025-08-07 и 2025-05-19) также доступны.

2Максимальное значение выходных маркеров зависит от базовых моделей в маршрутизаторе модели. Например, 32 768 (), 100 000 (GPT-4.1 series), 128 000 (o4-minigpt-5 reasoning models) и 16 384 (gpt-5-chat).

3 Более крупные контекстные окна совместимы с некоторыми базовыми моделями маршрутизатора модели. Это означает, что вызов API с большим контекстом завершается успешно, только если запрос перенаправляется в одну из таких моделей. В противном случае вызов завершается ошибкой.

4 Выставление счетов за развертывание маршрутизаторов модели "Стандартный" для зоны данных начинается не раньше 1 ноября 2025 г.

Модели Mistral, продаваемые в Azure

Модель Тип Возможности Тип развертывания (доступность региона)
mistral-document-ai-2512 Изображение к тексту - Входные данные: изображения или PDF-страницы (30 страниц, максимум 30 МБ PDF-файла)
- Выходные данные: текст
- Языки:en
- Вызов инструмента: нет
- Форматы ответов: Текст, JSON, Markdown
— глобальный стандарт (все регионы)
— стандарт зоны данных (США и ЕС)
mistral-document-ai-2505
Предварительный просмотр
Изображение к тексту - Входные данные: изображения или PDF-страницы (30 страниц, максимум 30 МБ PDF-файла)
- Выходные данные: текст
- Языки:en
- Вызов инструмента: нет
- Форматы ответов: Текст, JSON, Markdown
— глобальный стандарт (все регионы)
— стандарт зоны данных (США и ЕС)
Mistral-Large-3
Предварительный просмотр
завершение чата - Входные данные: текст, изображение
- Выходные данные: текст
- Языки:en, frdeesitptnlzh, и jakoar
- Вызов инструмента: Да
- Форматы ответов: Текст, JSON
— глобальный стандарт (все регионы)
— стандарт зоны данных (США и ЕС)

Несколько моделей Mistral также доступны через партнеров и сообщество.

Модели ИИ Moonshot, проданные Azure

Модели ИИ Moonshot включают Кими K2.6 (предварительная версия) и Кими K2.5 (предварительная версия), многомодальные модели причин, принимающие ввод текста и изображения.

Модель Тип Возможности Тип развертывания (доступность региона)
Kimi-K2.6
Предварительный просмотр
завершение чата
(с контентом аргументации)
- Входные данные: текст и изображение (262 144 токенов)
- Выходные данные: текст (262 144 токена)
- Языки:en И zh
- Вызов инструмента: Да
- Форматы ответов: Текст
— глобальный стандарт (все регионы)
Kimi-K2.5
Предварительный просмотр
завершение чата
(с контентом аргументации)
- Входные данные: текст и изображение (262 144 токенов)
- Выходные данные: текст (262 144 токена)
- Языки:en И zh
- Вызов инструмента: Да
- Форматы ответов: Текст
— глобальный стандарт (все регионы)

См . эту коллекцию моделей на портале Foundry.

Модели xAI, проданные Azure

Модели Grok xAI в Foundry Models включают разнообразный набор моделей с логическими и нелогическими способностями, предназначенных для корпоративных случаев использования, таких как извлечение данных, кодирование, сводка текста и агентные приложения.

Регистрация требуется для доступа кgrok-code-fast-1 (предварительная версия) и grok-4.

Модель Тип Возможности Тип развертывания (доступность региона)
grok-4.3
Предварительный просмотр
завершение чата - Входные данные: текст (200 000 маркеров)
- Выходные данные: текст (8 192 токенов)
- Языки:en
- Вызов инструмента: да
- Форматы ответов: текст
— глобальный стандарт (все регионы)
grok-4-20-reasoning
Предварительный просмотр
завершение чата - Входные данные: текст (262 000 токенов)
- Выходные данные: текст (8 192 токенов)
- Языки:en
- Вызов инструмента: да
- Форматы ответов: текст
— глобальный стандарт (все регионы)
grok-4-20-non-reasoning
Предварительный просмотр
завершение чата - Входные данные: текст (262 000 токенов)
- Выходные данные: текст (8 192 токенов)
- Языки:en
- Вызов инструмента: да
- Форматы ответов: текст
— глобальный стандарт (все регионы)
grok-4.1-fast-reasoning
Предварительный просмотр
завершение чата - Входные данные: текст, изображение (128 000 токенов)
- Выходные данные: текст (128 000 маркеров)
- Языки:en
- Вызов инструмента: да
- Форматы ответов: текст
— глобальный стандарт (все регионы)
grok-4.1-fast-non-reasoning
Предварительный просмотр
завершение чата - Входные данные: текст, изображение (128 000 токенов)
- Выходные данные: текст (128 000 маркеров)
- Языки:en
- Вызов инструмента: да
- Форматы ответов: текст
— глобальный стандарт (все регионы)
grok-4 завершение чата - Входные данные: текст (262 000 токенов)
- Выходные данные: текст (8 192 токенов)
- Языки:en
- Вызов инструмента: да
- Форматы ответов: текст
— глобальный стандарт (все регионы)
grok-code-fast-1
Предварительный просмотр
завершение чата - Входные данные: текст (256 000 маркеров)
- Выходные данные: текст (8 192 токенов)
- Языки:en
- Вызов инструмента: да
- Форматы ответов: текст
— глобальный стандарт (все регионы)

Доступность региона модели по типу развертывания

Microsoft Foundry предоставляет клиентам выбор в структуре размещения, которая соответствует их бизнесу и шаблонам использования. Служба предлагает две основные категории развертывания:

  • Стандарт: имеет глобальный вариант развертывания, маршрутизация трафика глобально для обеспечения более высокой пропускной способности.
  • Provisioned: также имеет глобальный вариант развертывания, позволяющий клиентам приобретать и развертывать подготовленные вычислительные единицы пропускной способности в глобальной инфраструктуре Azure.

Также доступны другие типы развертывания, такие как пакетная. Чтобы узнать о всех доступных типах развертывания моделей, см. Deployment types for Microsoft Foundry Models.

Доступность модели Global Standard

Регион FLUX.2-flex FLUX.2-pro FLUX.1-Kontext-pro FLUX-1.1-pro Cohere-rerank-v4.0-pro Cohere-rerank-v4.0-fast cohere-command-a embed-v-4-0 DeepSeek-V3.2-Speciale DeepSeek-V3.2 DeepSeek-V3.1 DeepSeek-R1-0528 DeepSeek-V3-0324 DeepSeek-R1 Лама-4-Maverick-17B-128E-Instruct-FP8 Лама-3.3-70B-Instruct MAI-Image-2 модель маршрутизатора mistral-document-ai-2512 mistral-document-ai-2505 Мистраль-Большой-3 Кими-K2.5 grok-4-1-fast-reasoning grok-4-1-fast-non-reasoning grok-4-fast-reasoning grok-4-fast-non-reasoning grok-3 grok-3-mini
австралия восток - -
бразилия-юг - -
canadacentral - -
canadaeast - -
centralus - -
eastus -
eastus2 -
francecentral - -
germanywestcentral - -
италиянорт - -
japaneast - -
japanwest - -
koreacentral - -
northcentralus - -
Норвегия восток - -
ПольшаЦентраль - -
southafricanorth - -
southcentralus - -
Южная Индия -
spaincentral - -
Швецияcentral
ШвейцарияНорт - -
швейцариязапад - -
уаенорт - -
uksouth - -
westcentralus -
westeurope -
westus -
westus2 - -
westus3 - -