Поделиться через


Модели Foundry, проданные непосредственно в Azure

Замечание

Этот документ относится к порталу Microsoft Foundry (классическая модель).

🔄 Перейдите в новую документацию по Microsoft Foundry, если вы используете новый портал.

Замечание

Этот документ относится к порталу Microsoft Foundry (new).

В этой статье перечислены некоторые модели Microsoft Foundry, проданные непосредственно Azure, а также их возможности, типы развертывания и регионы доступности, за исключением устаревших и устаревших моделей. Список моделей Azure OpenAI, поддерживаемых службой агента Foundry, см. в статье "Модели, поддерживаемые службой агента".

Модели, проданные непосредственно Azure, включают все модели Azure OpenAI и определенные, выбранные модели из лучших поставщиков.

В зависимости от типа проекта, используемого в Microsoft Foundry, вы увидите другой выбор моделей. В частности, если вы используете проект Foundry, построенный на ресурсе Foundry, вы увидите модели, доступные для стандартного развертывания в ресурсе Foundry. В качестве альтернативы, если вы используете проект на основе концентратора, размещенный в центре Foundry, вы увидите модели, доступные для развертывания в управляемой среде вычислений и бессерверных API. Эти выборки модели часто перекрываются, так как многие модели поддерживают несколько вариантов развертывания.

Модели Foundry доступны для стандартного развертывания в ресурсе Foundry.

Дополнительные сведения об атрибутах моделей Foundry, проданных непосредственно в Azure, см. в статье "Изучение моделей Foundry".

Замечание

Модели Foundry, проданные непосредственно в Azure, также включают выбор моделей из лучших поставщиков моделей, таких как:

  • Лаборатории Black Forest: FLUX.2-pro, FLUX.1-Kontext-pro, FLUX-1.1-pro
  • Cohere: Cohere-command-a, embed-v-4-0, Cohere-rerank-v4.0-proCohere-rerank-v4.0-fast
  • DeepSeek: DeepSeek-V3.2, DeepSeek-V3.2-Speciale, DeepSeek-V3.1DeepSeek-V3-0324, DeepSeek-R1-0528DeepSeek-R1
  • Moonshot AI: Kimi-K2-Thinking
  • Мета: Llama-4-Maverick-17B-128E-Instruct-FP8, Llama-3.3-70B-Instruct
  • Майкрософт: MAI-DS-R1, model-router
  • Мистраль: mistral-document-ai-2505, Mistral-Large-3
  • xAI: grok-code-fast-1, , grok-3grok-3-minigrok-4-fast-reasoning, grok-4-fast-non-reasoninggrok-4

Чтобы узнать об этих моделях, перейдите в другие коллекции моделей в верхней части этой статьи.

Azure OpenAI в моделях Microsoft Foundry

Azure OpenAI работает с различным набором моделей с разными возможностями и ценовыми точками. Доступность модели зависит от региона и облака. Сведения о доступности модели Azure для государственных организаций см. в Azure OpenAI в Azure для государственных организаций.

Models Description
Серия GPT-5.2 NEWgpt-5.2, gpt-5.2-chat (предварительная версия)
Серия GPT-5.1 NEWgpt-5.1, , gpt-5.1-chat, gpt-5.1-codexgpt-5.1-codex-mini
Сора НОВАЯ сора-2
Серия GPT-5 gpt-5, gpt-5-mini, gpt-5-nano, gpt-5-chat
gpt-oss Модели причин открытого веса
codex-mini Точно настроенная версия o4-mini.
Серия GPT-4.1 gpt-4.1, gpt-4.1-mini, gpt-4.1-nano
computer-use-preview Экспериментальная модель, обученная для использования с инструментом API Responses для работы с компьютером.
модели o-серии Модели рассуждений с расширенным решением проблем и повышением фокуса и возможностей.
GPT-4o, GPT-4o mini и GPT-4 Turbo Способные модели Azure OpenAI с многомодальными версиями, которые могут принимать как текст, так и изображения в качестве входных данных.
GPT-4 Набор моделей, которые улучшают GPT-3.5 и могут понимать и создавать естественный язык и код.
GPT-3.5 Набор моделей, которые улучшают GPT-3 и могут понимать и создавать естественный язык и код.
Embeddings Набор моделей, способных преобразовывать текст в числовую векторную форму для обеспечения сходства текстов.
генерация изображений Серия моделей, которые могут создавать исходные изображения на естественном языке.
Video generation Модель, которая может создавать исходные видео-сцены из текстовых инструкций.
Аудио Серия моделей для преобразования речи в текст, перевод и текст в речь. Звуковые модели GPT-4o поддерживают речь с низкой задержкой , взаимодействие с речью вне беседы или создание звука.

GPT-5.2

Доступность по регионам

Модель Регион
gpt-5.2 Восточная часть США2 и Центральная Швеция (глобальный стандарт)
gpt-5.2-chat Восточная часть США2 и Центральная Швеция (глобальный стандарт)

Доступ будет предоставлен на основе критериев соответствия требованиям Майкрософт. Клиенты, которые ранее подавали заявку и получили доступ к модели с ограниченным доступом, не нужно подавать заявку снова, так как утвержденные подписки автоматически будут предоставлены доступ при выпуске модели.

Идентификатор модели Description Окно контекста Максимальное количество выходных токенов Учебные данные (вплоть до)
gpt-5.2 (2025-12-11) - Рассуждение
— API завершения чата.
- API ответов.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции, инструменты и параллельные вызовы инструментов.
- Полная сводка возможностей.
400,000

Входные данные: 272 000
Выходные данные: 128 000
128,000 Октябрь 2024 г.
gpt-5.2-chat (2025-12-11)
Preview
— API завершения чата.
- API ответов.
— структурированные выходные данные
— Функции, инструменты и параллельные вызовы инструментов.
128,000

Входные данные: 111 616
Выходные данные: 16 384
16,384 Октябрь 2024 г.

ГПТ-5.1

Доступность по регионам

Модель Регион
gpt-5.1 Восточный регион США 2 и Центральный регион Швеции (Global Standard и DataZone Standard)
gpt-5.1-chat Восточная часть США2 и Центральная Швеция (глобальный стандарт)
gpt-5.1-codex Восточная часть США2 и Центральная Швеция (глобальный стандарт)
gpt-5.1-codex-mini Восточная часть США2 и Центральная Швеция (глобальный стандарт)
gpt-5.1-codex-max Восточная часть США2 и Центральная Швеция (глобальный стандарт)

Доступ будет предоставлен на основе критериев соответствия требованиям Майкрософт. Клиенты, которые ранее подавали заявку и получили доступ к модели с ограниченным доступом, не нужно подавать заявку снова, так как утвержденные подписки автоматически будут предоставлены доступ при выпуске модели.

Идентификатор модели Description Окно контекста Максимальное количество выходных токенов Учебные данные (вплоть до)
gpt-5.1 (2025-11-13) - Рассуждение
— API завершения чата.
- API ответов.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции, инструменты и параллельные вызовы инструментов.
- Полная сводка возможностей.
400,000

Входные данные: 272 000
Выходные данные: 128 000
128,000 30 сентября 2024 г.
gpt-5.1-chat (2025-11-13) - Рассуждение
— API завершения чата.
- API ответов.
— структурированные выходные данные
— Функции, инструменты и параллельные вызовы инструментов.
128,000

Входные данные: 111 616
Выходные данные: 16 384
16,384 30 сентября 2024 г.
gpt-5.1-codex (2025-11-13) - Только API ответов .
— Обработка текста и изображений
— структурированные выходные данные.
— Функции, инструменты и параллельные вызовы инструментов.
- Полная сводка возможностей
— Оптимизировано для расширения Codex CLI и Codex VS Code
400,000

Входные данные: 272 000
Выходные данные: 128 000
128,000 30 сентября 2024 г.
gpt-5.1-codex-mini (2025-11-13) - Только API ответов .
— Обработка текста и изображений
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции, инструменты и параллельные вызовы инструментов.
- Полная сводка возможностей
— Оптимизировано для расширения Codex CLI и Codex VS Code
400,000

Входные данные: 272 000
Выходные данные: 128 000
128,000 30 сентября 2024 г.
gpt-5.1-codex-max (2025-12-04) - Только API ответов .
— Обработка текста и изображений
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции, инструменты и параллельные вызовы инструментов.
- Полная сводка возможностей
— Оптимизировано для расширения Codex CLI и Codex VS Code
400,000

Входные данные: 272 000
Выходные данные: 128 000
128,000 30 сентября 2024 г.

Это важно

  • gpt-5.1 reasoning_effort по умолчанию равен none. При обновлении с предыдущих моделей рассуждений до gpt-5.1, помните, что может потребоваться обновить ваш код, чтобы явно указать уровень reasoning_effort, если вы хотите, чтобы произошло рассуждение.

  • gpt-5.1-chat добавляет встроенные возможности рассуждений. Как и другие модели причин , они не поддерживают такие параметры temperature. При переходе от использования gpt-5-chat (которая не является моделью рассуждения) к gpt-5.1-chat убедитесь, что вы удаляете из кода все пользовательские параметры, такие как temperature, которые не поддерживаются моделями рассуждения.

  • gpt-5.1-codex-max добавляет поддержку установки reasoning_effort для xhigh. Использование рассуждательной возможности none не поддерживается gpt-5.1-codex-max.

GPT-5

Доступность по регионам

Модель Регион
gpt-5 (2025-08-07) См. таблицу моделей.
gpt-5-mini (2025-08-07) См. таблицу моделей.
gpt-5-nano (2025-08-07) См. таблицу моделей.
gpt-5-chat (2025-08-07) См. таблицу моделей.
gpt-5-chat (2025-10-03) Восточная часть США2 (глобальный стандарт) и Центральная Швеция (глобальный стандарт)
gpt-5-codex (2025-09-11) Восточная часть США2 (глобальный стандарт) и Центральная Швеция (глобальный стандарт)
gpt-5-pro (2025-10-06) Восточная часть США2 (глобальный стандарт) и Центральная Швеция (глобальный стандарт)

Доступ будет предоставлен на основе критериев соответствия требованиям Майкрософт. Клиенты, которые ранее подали заявку и получили доступ, не должны повторно подавать заявку, так как их утвержденные подписки автоматически получат доступ при выпуске модели.

Идентификатор модели Description Окно контекста Максимальное количество выходных токенов Учебные данные (вплоть до)
gpt-5 (2025-08-07) - Рассуждение
— API завершения чата.
- API ответов.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции, инструменты и параллельные вызовы инструментов.
- Полная сводка возможностей.
400,000

Входные данные: 272 000
Выходные данные: 128 000
128,000 30 сентября 2024 г.
gpt-5-mini (2025-08-07) - Рассуждение
— API завершения чата.
- API ответов.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции, инструменты и параллельные вызовы инструментов.
- Полная сводка возможностей.
400,000

Входные данные: 272 000
Выходные данные: 128 000
128,000 31 мая 2024 г.
gpt-5-nano (2025-08-07) - Рассуждение
— API завершения чата.
- API ответов.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции, инструменты и параллельные вызовы инструментов.
- Полная сводка возможностей.
400,000

Входные данные: 272 000
Выходные данные: 128 000
128,000 31 мая 2024 г.
gpt-5-chat (2025-08-07)
Preview
— API завершения чата.
- API ответов.
- Входные данные: текст и изображение
- Выходные данные: только текст
128,000 16,384 30 сентября 2024 г.
gpt-5-chat (2025-10-03)
Предварительный просмотр1
— API завершения чата.
- API ответов.
- Входные данные: текст и изображение
- Выходные данные: только текст
128,000 16,384 30 сентября 2024 г.
gpt-5-codex (2025-09-11) - Только API ответов .
- Входные данные: текст и изображение
- Выходные данные: только текст
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции, инструменты и параллельные вызовы инструментов.
- Полная сводка возможностей
— Оптимизировано для расширения Codex CLI и Codex VS Code
400,000

Входные данные: 272 000
Выходные данные: 128 000
128,000 -
gpt-5-pro (2025-10-06) - Рассуждение
- API ответов.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции и инструменты
- Полная сводка возможностей.
400,000

Входные данные: 272 000
Выходные данные: 128 000
128,000 30 сентября 2024 г.

Замечание

1gpt-5-chat версия 2025-10-03 представляет значительное улучшение, ориентированное на эмоциональный интеллект и возможности психического здоровья. Это обновление интегрирует специализированные наборы данных и усовершенствованные стратегии реагирования для улучшения способности модели:

  • Узнайте и интерпретируйте эмоциональный контекст более точно, способствуя более тонким и эмпатическим взаимодействиям.
  • Предоставляйте поддерживающие и ответственные ответы в разговорах, связанных с психическим здоровьем, обеспечивая деликатность и соблюдение лучших практик.

Эти улучшения стремятся сделать GPT-5-чат более учитывающим контекст, ориентированным на человека и надежным в сценариях, где важно учитывать эмоциональный тон и благополучие.

gpt-oss

Доступность по регионам

Модель Регион
gpt-oss-120b Все регионы Azure OpenAI

Capabilities

Идентификатор модели Description Окно контекста Максимальное количество выходных токенов Учебные данные (вплоть до)
gpt-oss-120b (предварительная версия) — только текст в/тексте
— API завершения чата
- Потоковое воспроизведение
— Вызов функции
— структурированные выходные данные
-Рассуждение
— доступно для развертывания1 и с помощью управляемых вычислений
131,072 131,072 31 мая 2024 г.
gpt-oss-20b (предварительная версия) — только текст в/тексте
— API завершения чата
- Потоковое воспроизведение
— Вызов функции
— структурированные выходные данные
-Рассуждение
— доступно с помощью управляемых вычислений и литейных локальных вычислений
131,072 131,072 31 мая 2024 г.

1 В отличие от других моделей gpt-oss-120b Azure OpenAI, требуется проект Foundry для развертывания модели.

Развертывание с помощью кода

az cognitiveservices account deployment create \
  --name "Foundry-project-resource" \
  --resource-group "test-rg" \
  --deployment-name "gpt-oss-120b" \
  --model-name "gpt-oss-120b" \
  --model-version "1" \
  --model-format "OpenAI-OSS" \
  --sku-capacity 10 \
  --sku-name "GlobalStandard"

Серия GPT-4.1

Доступность по регионам

Модель Регион
gpt-4.1 (2025-04-14) См. таблицу моделей.
gpt-4.1-nano (2025-04-14) См. таблицу моделей.
gpt-4.1-mini (2025-04-14) См. таблицу моделей.

Capabilities

Это важно

Известная проблема влияет на все модели серии GPT 4.1. Крупные определения вызовов инструментов или функций, превышающие 300 000 маркеров, приводят к сбоям, даже если не достигнут предел контекста маркера в 1 млн.

Ошибки могут отличаться на основе вызовов API и базовых характеристик полезных данных.

Ниже приведены сообщения об ошибках ДЛЯ API завершения чата:

  • Error code: 400 - {'error': {'message': "This model's maximum context length is 300000 tokens. However, your messages resulted in 350564 tokens (100 in the messages, 350464 in the functions). Please reduce the length of the messages or functions.", 'type': 'invalid_request_error', 'param': 'messages', 'code': 'context_length_exceeded'}}

  • Error code: 400 - {'error': {'message': "Invalid 'tools[0].function.description': string too long. Expected a string with maximum length 1048576, but got a string with length 2778531 instead.", 'type': 'invalid_request_error', 'param': 'tools[0].function.description', 'code': 'string_above_max_length'}}

Ниже приведено сообщение об ошибке ДЛЯ API ответов:

  • Error code: 500 - {'error': {'message': 'The server had an error processing your request. Sorry about that! You can retry your request, or contact us through an Azure support request at: https://go.microsoft.com/fwlink/?linkid=2213926 if you keep seeing this error. (Please include the request ID d2008353-291d-428f-adc1-defb5d9fb109 in your email.)', 'type': 'server_error', 'param': None, 'code': None}}
Идентификатор модели Description Окно контекста Максимальное количество выходных маркеров Обучающие данные (до)
gpt-4.1 (2025-04-14) — ввод текста и изображения
— вывод текста
— API завершения чата
— API ответов
- Потоковое воспроизведение
— Вызов функции
— структурированные выходные данные (завершение чата)
- 1,047,576
— 128 000 (подготовленные управляемые развертывания)
— 300 000 (пакетные развертывания)
32,768 31 мая 2024 г.
gpt-4.1-nano (2025-04-14) — ввод текста и изображения
— вывод текста
— API завершения чата
— API ответов
- Потоковое воспроизведение
— Вызов функции
— структурированные выходные данные (завершение чата)
- 1,047,576
— 128 000 (подготовленные управляемые развертывания)
— 300 000 (пакетные развертывания)
32,768 31 мая 2024 г.
gpt-4.1-mini (2025-04-14) — ввод текста и изображения
— вывод текста
— API завершения чата
— API ответов
- Потоковое воспроизведение
— Вызов функции
— структурированные выходные данные (завершение чата)
- 1,047,576
— 128 000 (подготовленные управляемые развертывания)
— 300 000 (пакетные развертывания)
32,768 31 мая 2024 г.

computer-use-preview

Экспериментальная модель, обученная для использования с инструментом API ответов.

Его можно использовать с сторонними библиотеками, чтобы позволить модели управлять вводом мыши и клавиатуры, а также получать контекст из снимков экрана текущей среды.

Caution

Мы не рекомендуем использовать предварительные версии моделей в рабочей среде. Мы обновим все развертывания моделей предварительной версии до будущих версий предварительной версии или до последней стабильной общедоступной версии. Модели, назначенные предварительной версией, не соответствуют стандартному жизненному циклу модели Azure OpenAI.

Для доступа computer-use-previewтребуется регистрация. Доступ предоставляется на основе критериев соответствия корпорации Майкрософт. Клиенты, имеющие доступ к другим моделям ограниченного доступа, по-прежнему должны запрашивать доступ к этой модели.

Чтобы запросить доступ, перейдите к приложениюcomputer-use-preview модели ограниченного доступа. При предоставлении доступа необходимо создать развертывание для модели.

Доступность по регионам

Модель Регион
computer-use-preview См. таблицу моделей.

Capabilities

Идентификатор модели Description Окно контекста Максимальное количество выходных маркеров Обучающие данные (до)
computer-use-preview (2025-03-11) Специализированная модель для использования с инструментом API ответов

-Инструменты
- Стриминг
— Текст (входные и выходные данные)
— изображение (входные данные)
8,192 1,024 Октябрь 2023

модели o-серии

Модели O-серии Azure OpenAI предназначены для решения задач по устранению причин и решению проблем с повышенным фокусом и возможностями. Эти модели тратят больше времени на обработку и понимание запроса пользователя, что делает их исключительно сильными в таких областях, как наука, программирование и математика, по сравнению с предыдущими итерациями.

Идентификатор модели Description Максимальный запрос (токены) Обучающие данные (до)
codex-mini (2025-05-16) Точно настроенная версия o4-mini.
- API ответов.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции и инструменты.
Полная сводка возможностей.
Входные данные: 200 000
Результат: 100 000
31 мая 2024 г.
o3-pro (2025-06-10) - API ответов.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции и инструменты.
Полная сводка возможностей.
Входные данные: 200 000
Результат: 100 000
31 мая 2024 г.
o4-mini (2025-04-16) - Новая модель рассуждений, предлагающая расширенные возможности аргументирования.
— API завершения чата.
- API ответов.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции и инструменты.
Полная сводка возможностей.
Входные данные: 200 000
Результат: 100 000
31 мая 2024 г.
o3 (2025-04-16) - Новая модель рассуждений, предлагающая расширенные возможности аргументирования.
— API завершения чата.
- API ответов.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции, инструменты и параллельные вызовы инструментов.
Полная сводка возможностей.
Входные данные: 200 000
Результат: 100 000
31 мая 2024 г.
o3-mini (2025-01-31) - Расширенные способности рассудка.
— структурированные выходные данные.
— обработка только для текста.
— Функции и инструменты.
Входные данные: 200 000
Результат: 100 000
Октябрь 2023
o1 (2024-12-17) - Расширенные способности рассудка.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции и инструменты.
Входные данные: 200 000
Результат: 100 000
Октябрь 2023
o1-preview (2024-09-12) Более ранняя предварительная версия. Вход: 128 000
Выход: 32 768
Октябрь 2023
o1-mini (2024-09-12) Более быстрый и более экономичный вариант в серии o1 идеально подходит для задач программирования, требующих скорости и снижения потребления ресурсов.
— Глобальное развертывание уровня "Стандартный", доступное по умолчанию.
— Развертывания уровня "Стандартный" (региональные) в настоящее время доступны только для тех клиентов, которые получили доступ в рамках выпуска ограниченного o1-preview доступа.
Вход: 128 000
Результат: 65 536
Октябрь 2023

Дополнительные сведения о расширенных моделях серии o см. в статье "Начало работы с моделями причин".

Доступность по регионам

Модель Регион
codex-mini Восточная часть США 2 и Центральная Швеция (глобальный стандарт).
o3-pro Восточная часть США 2 и Центральная Швеция (глобальный стандарт).
o4-mini См. таблицу моделей.
o3 См. таблицу моделей.
o3-mini См. таблицу моделей.
o1 См. таблицу моделей.
o1-preview См. таблицу моделей. Эта модель доступна только для клиентов, которым предоставлен доступ в рамках исходного ограниченного доступа.
o1-mini См. таблицу моделей.

GPT-4o и GPT-4 Turbo

GPT-4o интегрирует текст и изображения в одну модель, что позволяет одновременно обрабатывать несколько типов данных. Этот многомодальный подход повышает точность и скорость реагирования на взаимодействие с компьютером. GPT-4o соответствует GPT-4 Turbo в задачах английского текста и программирования, обеспечивая более высокую производительность в задачах, отличных от английского языка, и задачах визуального зрения, устанавливая новые тесты для возможностей искусственного интеллекта.

Модели GPT-4 и GPT-4 Turbo

Эти модели можно использовать только с API завершения чата.

Сведения о том, как Azure OpenAI обрабатывает обновления версий модели, см. в версиях модели. Ознакомьтесь с моделями, чтобы узнать, как просматривать и настраивать параметры версии модели для развертываний GPT-4.

Идентификатор модели Description Максимальный запрос (токены) Обучающие данные (до)
gpt-4o (2024-11-20)
GPT-4o (Omni)
— структурированные выходные данные.
— Обработка текста и изображения.
— режим JSON.
— параллельный вызов функции.
— улучшенная точность и скорость реагирования.
— Паритетность с английским текстом и задачами программирования по сравнению с GPT-4 Turbo с Vision.
— высокая производительность на языках, отличных от английского языка, и в задачах визуального зрения.
- Улучшенные творческие способности писать.
Вход: 128 000
Выходные данные: 16 384
Октябрь 2023
gpt-4o (2024-08-06)
GPT-4o (Omni)
— структурированные выходные данные.
— Обработка текста и изображения.
— режим JSON.
— параллельный вызов функции.
— улучшенная точность и скорость реагирования.
— Паритетность с английским текстом и задачами программирования по сравнению с GPT-4 Turbo с Vision.
— высокая производительность на языках, отличных от английского языка, и в задачах визуального зрения.
Вход: 128 000
Выходные данные: 16 384
Октябрь 2023
gpt-4o-mini (2024-07-18)
GPT-4o mini
— Быстрая, недорогая, способная модель, идеально подходящая для замены моделей серии GPT-3.5 Turbo.
— Обработка текста и изображения.
— режим JSON.
— параллельный вызов функции.
Вход: 128 000
Выходные данные: 16 384
Октябрь 2023
gpt-4o (2024-05-13)
GPT-4o (Omni)
— Обработка текста и изображения.
— режим JSON.
— параллельный вызов функции.
— улучшенная точность и скорость реагирования.
— Паритетность с английским текстом и задачами программирования по сравнению с GPT-4 Turbo с Vision.
— высокая производительность на языках, отличных от английского языка, и в задачах визуального зрения.
Вход: 128 000
Выходные данные: 4 096
Октябрь 2023
gpt-4 (turbo-2024-04-09)
GPT-4 Turbo с vision
Новая общедоступная модель.
— Замена всех предыдущих моделей GPT-4 (vision-preview, 1106-Preview, 0125-Preview).
- Доступность компонентов в настоящее время отличается в зависимости от метода ввода и типа развертывания.
Вход: 128 000
Выходные данные: 4 096
Декабрь 2023 г.

Caution

Мы не рекомендуем использовать предварительные версии моделей в рабочей среде. Мы обновим все развертывания моделей предварительной версии до будущих версий предварительной версии или до последней стабильной общедоступной версии. Модели, назначенные предварительной версией, не соответствуют стандартному жизненному циклу модели Azure OpenAI.

GPT-3.5

Модели GPT-3.5 могут понять и создать естественный язык или код. Наиболее эффективной и экономичной моделью в семействе GPT-3.5 является GPT-3.5 Turbo, оптимизированная для чата, а также хорошо подходит для традиционных задач завершения. GPT-3.5 Turbo доступен для использования с API завершения чата. Служба GPT-3.5 Turbo Instruct имеет аналогичные text-davinci-003 возможности при использовании API завершения вместо API завершения чата. Мы рекомендуем использовать GPT-3.5 Turbo и GPT-3.5 Turbo Instruct над устаревшими моделями GPT-3.5 и GPT-3.

Идентификатор модели Description Максимальный запрос (токены) Обучающие данные (до)
gpt-35-turbo (0125) новые — режим JSON.
— параллельный вызов функции.
— воспроизводимые выходные данные (предварительная версия).
— более высокая точность при реагировании в запрошенных форматах.
— Включает исправление ошибки, вызвавшей проблему с кодировкой текста для вызовов функций, отличных от английского языка.
Входные данные: 16 385
Выходные данные: 4 096
Сентябрь 2021 г.
gpt-35-turbo (1106) Более старая общедоступная модель.
— режим JSON.
— параллельный вызов функции.
— воспроизводимые выходные данные (предварительная версия).
Входные данные: 16 385
Выходные данные: 4 096
Сентябрь 2021 г.
gpt-35-turbo-instruct (0914) Только конечная точка завершения.
— замена устаревших моделей завершения.
4,097 Сентябрь 2021 г.

Дополнительные сведения о взаимодействии с GPT-3.5 Turbo и API завершения чата см. в нашей подробной статье.

Встраивания

text-embedding-3-large является последней и самой способной моделью внедрения. Невозможно обновить между моделями внедрения. Чтобы перейти с использования text-embedding-ada-002text-embedding-3-large, необходимо создать новые внедрения.

  • text-embedding-3-large
  • text-embedding-3-small
  • text-embedding-ada-002

Отчеты OpenAI, которые показывают, что модели внедрения большого и небольшого третьего поколения обеспечивают более высокую производительность многоязычного извлечения с помощью теста MIRACL . Они по-прежнему поддерживают производительность для английских задач с помощью теста MTEB .

Тест оценки text-embedding-ada-002 text-embedding-3-small text-embedding-3-large
Среднее значение MIRACL 31.4 44.0 54.9
Среднее значение MTEB 61.0 62.3 64.6

Модели внедрения третьего поколения поддерживают уменьшение размера внедрения с помощью нового dimensions параметра. Как правило, более крупные внедрения являются более дорогими с точки зрения вычислений, памяти и хранилища. При настройке количества измерений вы получаете больше контроля над общими затратами и производительностью. Параметр dimensions не поддерживается во всех версиях библиотеки Python OpenAI 1.x. Чтобы воспользоваться этим параметром, рекомендуется обновить до последней версии: pip install openai --upgrade

Тестирование тестов MTEB в OpenAI показало, что даже если размеры модели третьего text-embeddings-ada-002поколения сокращаются до меньше 1536 измерений, производительность остается немного лучше.

Модели создания изображений

Модели создания изображений создают изображения из текстовых запросов, которые предоставляет пользователь. Модели серии GPT-image-1 находятся в предварительной версии ограниченного доступа. DALL-E 3 обычно доступен для использования с интерфейсами REST API. DALL-E 2 и DALL-E 3 с клиентскими SDK доступны в предварительном просмотре.

Регистрация требуется для доступа gpt-image-1, gpt-image-1-miniили gpt-image-1.5. Доступ предоставляется на основе критериев соответствия корпорации Майкрософт. Клиенты, имеющие доступ к другим моделям ограниченного доступа, по-прежнему должны запрашивать доступ к этой модели.

Чтобы запросить доступ, заполните форму заявки: Подать заявку на доступ к GPT-image-1; Подать заявку на доступ к GPT-image-1.5. При предоставлении доступа необходимо создать развертывание для модели.

Доступность по регионам

Модель Регион
dall-e-3 East US
Australia East
Центральная Швеция
gpt-image-1 Западная часть США 3 (глобальный стандарт)
Восток США 2 (Глобальный стандарт)
Север ОАЭ (глобальный стандарт)
Центральная Польша (глобальный стандарт)
Центральная Швеция (глобальный стандарт)
gpt-image-1-mini Западная часть США 3 (глобальный стандарт)
Восток США 2 (Глобальный стандарт)
Север ОАЭ (глобальный стандарт)
Центральная Польша (глобальный стандарт)
Центральная Швеция (глобальный стандарт)
gpt-image-1.5 Западная часть США 3 (глобальный стандарт)
Восток США 2 (Глобальный стандарт)
Север ОАЭ (глобальный стандарт)
Центральная Польша (глобальный стандарт)
Центральная Швеция (глобальный стандарт)

Модели создания видео

Sora — это модель ИИ из OpenAI, которая может создавать реалистичные и образные видео сцены из текстовых инструкций. Sora находится в предварительной версии.

Доступность по регионам

Модель Регион
sora Восточная часть США 2 (глобальный стандарт)
Центральная Швеция (глобальный стандарт)
sora-2 Восточная часть США 2 (глобальный стандарт)
Центральная Швеция (глобальный стандарт)

Звуковые модели

Звуковые модели в Azure OpenAI доступны через API realtime, completions и интерфейсы audio API.

Aудиомодели GPT-4o

Звуковые модели GPT-4o являются частью семейства моделей GPT-4o и поддерживают низкую задержку, речь в, речевые взаимодействия или звуковое поколение.

Caution

Мы не рекомендуем использовать предварительные версии моделей в рабочей среде. Мы обновим все развертывания моделей предварительной версии до будущих версий предварительной версии или до последней стабильной общедоступной версии. Модели, назначенные предварительной версией, не соответствуют стандартному жизненному циклу модели Azure OpenAI.

Сведения о максимальных маркерах запроса и обучающих данных доступны в следующей таблице:

Идентификатор модели Description Максимальный запрос (токены) Обучающие данные (до)
gpt-4o-mini-audio-preview (2024-12-17)
Аудио GPT-4o
Звуковая модель для создания звука и текста. Вход: 128 000
Выходные данные: 16 384
Сентябрь 2023 г.
gpt-4o-audio-preview (2024-12-17)
Аудио GPT-4o
Звуковая модель для создания звука и текста. Вход: 128 000
Выходные данные: 16 384
Сентябрь 2023 г.
gpt-4o-realtime-preview (2025-06-03)
Аудио GPT-4o
Звуковая модель для обработки звука в режиме реального времени. Вход: 128 000
Выходные данные: 4 096
Октябрь 2023
gpt-4o-realtime-preview (2024-12-17)
Аудио GPT-4o
Звуковая модель для обработки звука в режиме реального времени. Вход: 128 000
Выходные данные: 4 096
Октябрь 2023
gpt-4o-mini-realtime-preview (2024-12-17)
Аудио GPT-4o
Звуковая модель для обработки звука в режиме реального времени. Вход: 128 000
Выходные данные: 4 096
Октябрь 2023
gpt-realtime (2025-08-28) (GA)
gpt-realtime-mini (2025-10-06)
gpt-realtime-mini-2025-12-15 (2025-12-15)
gpt-audio(28.08.2025)
gpt-audio-mini(06.10.2025)
Звуковая модель для обработки звука в режиме реального времени. Входные данные: 28 672
Выходные данные: 4 096
Октябрь 2023

Чтобы сравнить доступность звуковых моделей GPT-4o во всех регионах, см. в таблице моделей.

API для работы с аудио

Звуковые модели с помощью /audio API можно использовать для преобразования речи в текст, перевод и текст в речь.

Модели преобразования речи в текст

Идентификатор модели Description Максимальный запрос (размер аудиофайла)
whisper Модель распознавания речи общего назначения. 25 Мб
gpt-4o-transcribe Модель преобразования речи в текст на основе GPT-4o. 25 Мб
gpt-4o-mini-transcribe Модель преобразования речи в текст с помощью GPT-4o mini. 25 Мб
gpt-4o-transcribe-diarize Модель преобразования речи в текст с автоматическим распознаванием речи. 25 Мб
gpt-4o-mini-transcribe-2025-12-15 Модель преобразования речи в текст с автоматическим распознаванием речи. Улучшена точность транскрибирования и надежность. 25 Мб

Модели перевода речи

Идентификатор модели Description Максимальный запрос (размер аудиофайла)
whisper Модель распознавания речи общего назначения. 25 Мб

Модели преобразования текста в речь (предварительная версия)

Идентификатор модели Description
tts Модель преобразования текста в речь, оптимизированная для скорости.
tts-hd Модель преобразования текста в речь, оптимизированная для качества.
gpt-4o-mini-tts Модель преобразования текста в речь с помощью GPT-4o mini.

Вы можете управлять голосом, чтобы говорить в определенном стиле или тоне.
gpt-4o-mini-tts-2025-12-15 Модель преобразования текста в речь с помощью GPT-4o mini.

Вы можете управлять голосом, чтобы говорить в определенном стиле или тоне.

Дополнительные сведения см. в статье о доступности регионов звуковых моделей далее в этой статье.

Сводка модели и доступность в регионе

Модели по типу развертывания

Azure OpenAI предоставляет клиентам выбор в структуре размещения, которая соответствует своим бизнес-шаблонам и шаблонам использования. Служба предлагает два основных типа развертывания:

  • Стандарт: имеет глобальный вариант развертывания, маршрутизация трафика глобально для обеспечения более высокой пропускной способности.
  • Подготовлено: также имеет глобальный вариант развертывания, позволяющий клиентам приобретать и развертывать подготовленные единицы пропускной способности в глобальной инфраструктуре Azure.

Все развертывания могут выполнять те же операции вывода, но выставление счетов, масштабирование и производительность существенно отличаются. Дополнительные сведения о типах развертывания Azure OpenAI см. в руководстве по типам развертывания.

Доступность глобальной модели уровня "Стандартный"

Регион gpt-5.2, 2025-12-11 gpt-5.2-chat, 2025-12-11 gpt-5.1, 2025-11-13 gpt-5.1-chat, 2025-11-13 gpt-5.1-codex, 2025-11-13 gpt-5.1-codex-mini, 2025-11-13 gpt-5-pro, 2025-10-06 gpt-5, 2025-08-07 gpt-5-mini, 2025-08-07 gpt-5-nano, 2025-08-07 gpt-5-chat, 2025-08-07 gpt-5-chat, 2025-10-03 o3-pro, 2025-06-10 codex-mini, 2025-05-16 sora, 2025-05-02 Модель маршрутизатора, 2025-08-07 модель-маршрутизатор, 2025-05-19 модель-маршрутизатор, 2025-11-18 o3, 2025-04-16 o4-mini, 2025-04-16 gpt-image-1, 2025-04-15 gpt-4.1, 2025-04-14 gpt-4.1-nano, 2025-04-14 gpt-4.1-mini, 2025-04-14 предварительный просмотр использования компьютера, 11.03.2025 o3-mini, 2025-01-31 o1, 2024-12-17 o1-mini, 2024-09-12 gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o, 2024-11-20 gpt-4o-mini, 2024-07-18 text-embedding-3-small, 1 text-embedding-3-large, 1 text-embedding-ada-002, 2 gpt-4o-realtime-preview, 2024-12-17 gpt-4o-realtime-preview, 2025-06-03 gpt-4o-audio-preview, 2024-12-17 gpt-4o-mini-realtime-preview, 2024-12-17 gpt-4o-mini-audio-preview, 2024-12-17 gpt-4o-transcribe, 2025-03-20 gpt-4o-mini-tts, 2025-03-20 gpt-4o-mini-transcribe, 2025-03-20 gpt-5-codex, 2025-09-15 gpt-realtime, 2025-08-28 gpt-audio-mini, 2025-10-06 gpt-image-1-mini, 2025-10-06 gpt-realtime-mini, 2025-10-06 gpt-audio, 2025-08-28 sora-2, 2025-10-06 o3-deep-research, 2025-06-26 gpt-4o-transcribe-diarize, 2025-10-15
австралиявосток - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Бразильский Юг - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Центральная Канада - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Канада Восток - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Центральус - - - - - - - - - - - - - - - - - - - - - - - - -
Истус - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
eastus2 -
francecentral - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Германия-запад-центр - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
северная италия - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
japaneast - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
koreacentral - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
northcentralus - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Норвегия Восток - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Польша Центральная - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Южная Африка-север - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
СаутЦентралус - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
southeastasia - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Южная Индия - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
spaincentral - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
SwedenCentral - - -
Швейцария север - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
switzerlandwest - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
uaenorth - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
UKSOUTH - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Западная Европа - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Вестус - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
westus3 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

Замечание

o3-deep-research доступен только с Foundry Agent Service. Дополнительные сведения см. в руководстве по глубокому исследованию.

Эта таблица не содержит сведения о точной настройке региональной доступности. Ознакомьтесь с разделом по тонкой настройке для получения этой информации.

Стандартные модели развертывания (региональные) по конечной точке

Завершение чата

Регион o1-preview, 2024-09-12 o1-mini, 2024-09-12 gpt-4o, 2024-05-13 gpt-4o, 2024-11-20 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4, turbo-2024-04-09 gpt-35-turbo, 1106 gpt-35-turbo, 0125
австралиявосток - - - - - -
Канада Восток - - - - - -
Истус -
eastus2 -
francecentral - - - - - -
japaneast - - - - - - -
northcentralus -
Норвегия Восток - - - - - - - -
СаутЦентралус -
Южная Индия - - - - - -
SwedenCentral
Швейцария север - - - - - - -
UKSOUTH - - - - - -
Западная Европа - - - - - - - -
Вестус
westus3 -

Замечание

o1-mini в настоящее время доступен всем клиентам для развертывания Global Standard.

Выбранным клиентам был предоставлен стандартный (региональный) доступ к развертыванию o1-mini в рамках ограниченного выпуска o1-preview. В настоящее время доступ к стандартным o1-mini (региональным) развертываниям не расширяется.

Сведения о том, как Azure OpenAI обрабатывает обновления версий модели, см. в разделе "Версии модели". Сведения о просмотре и настройке параметров версии модели для развертываний GPT-3.5 Turbo см. в статье "Работа с моделями".

Тонкая настройка моделей

Замечание

Поддерживаемые регионы для точной настройки могут отличаться, если вы используете модели Azure OpenAI в проекте Microsoft Foundry и вне проекта.

Идентификатор модели Стандартные регионы Глобальный Developer Максимальный запрос (токены) Обучающие данные (до) Modality
gpt-4o-mini
(2024-07-18)
Северная часть США
Центральная Швеция
Вход: 128 000
Результат: 16 384
Длина контекста примера обучения: 65 536
Октябрь 2023 г. Текст в текст
gpt-4o
(2024-08-06)
Восточная часть США2
Северная часть США
Центральная Швеция
Вход: 128 000
Результат: 16 384
Длина контекста примера обучения: 65 536
Октябрь 2023 г. Текст и визуальное представление для текста
gpt-4.1
(2025-04-14)
Северная часть США
Центральная Швеция
Вход: 128 000
Результат: 16 384
Длина контекста примера обучения: 65 536
май 2024 Текст и визуальное представление для текста
gpt-4.1-mini
(2025-04-14)
Северная часть США
Центральная Швеция
Вход: 128 000
Результат: 16 384
Длина контекста примера обучения: 65 536
май 2024 Текст в текст
gpt-4.1-nano (2025-04-14) Северная часть США
Центральная Швеция
Вход: 128 000
Результат: 16 384
Длина контекста примера обучения: 32 768
май 2024 Текст в текст
o4-mini
(2025-04-16)
Восточная часть США2
Центральная Швеция
Вход: 128 000
Результат: 16 384
Длина контекста примера обучения: 65 536
май 2024 Текст в текст
Ministral-3B (предварительная версия)
(2411)
Не поддерживается Вход: 128 000
Выходные данные: неизвестно
Длина контекста примера обучения: Неизвестно
Неизвестно Текст в текст
Qwen-32B (предварительная версия) Не поддерживается Входные данные: 8 000
Выход: 32 000
Длина контекста примера обучения: 8192
Июль 2024 г. Текст в текст

Замечание

Глобальное обучение обеспечивает более доступную стоимость обучения за токен, но не предлагает размещение данных на месте. В настоящее время он доступен для ресурсов Foundry в следующих регионах:

  • Australia East
  • Бразилия (Юг)
  • Canada Central
  • Canada East
  • East US
  • Восток США2
  • Центральная Франция
  • Западно-Центральная Германия
  • Italy North
  • Восточная Япония (нет поддержки зрения)
  • Korea Central
  • северо-центральная часть США
  • Norway East
  • Центральная Польша (нет поддержки 4.1-nano)
  • Юго-Восточная Азия
  • Север Южной Африки
  • Южно-Центральная часть США
  • South India
  • Spain Central
  • Центральная Швеция
  • Switzerland West
  • Switzerland North
  • UK South
  • West Europe
  • West US
  • Западная часть США3

Помощники (предварительная версия)

Для помощников требуется сочетание поддерживаемой модели и поддерживаемого региона. Для некоторых инструментов и возможностей требуются последние модели. Следующие модели доступны в API Помощников, пакете SDK и Foundry. Следующая таблица предназначена для стандартного развертывания. Сведения о доступности подготовленной единицы пропускной способности см. в разделе "Подготовленная пропускная способность". Перечисленные модели и регионы можно использовать как с помощниками версии 1, так и с версией 2. Вы можете использовать модели global Standard , если они поддерживаются в следующих регионах.

Регион gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4, 0613 gpt-4, 1106-Предварительный просмотр gpt-4, 0125-Preview gpt-4, turbo-2024-04-09 gpt-4-32k, 0613 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613
австралиявосток - - - - -
Истус - - - -
eastus2 - - - -
francecentral - - - - - -
japaneast - - - - - - - - -
Норвегия Восток - - - - - - - - - - -
Южная Индия - - - - - - - - -
SwedenCentral - -
UKSOUTH - - - - - -
Вестус - - - - -
westus3 - - - - - -

Вывод модели из эксплуатации

Последние сведения о выводе моделей из эксплуатации см. в руководстве по выводу моделей из эксплуатации.

Замечание

Модели Foundry, проданные непосредственно в Azure, также включают все модели Azure OpenAI. Чтобы узнать об этих моделях, перейдите в коллекцию моделей Azure OpenAI в верхней части этой статьи.

Модели Black Forest Labs, проданные непосредственно в Azure

Коллекция моделей создания изображений Black Forest Labs (BFL) включает FLUX.2 [pro] для создания изображений и редактирования с помощью текстовых и графических запросов, FLUX.1 Kontext [pro] для создания и редактирования в контексте, а также FLUX1.1 [pro] для создания текста в изображение.

Эти модели можно запускать с помощью API поставщика услуг BFL и через конечные точки images/generations и images/edits.

Модель Тип и конечная точка API Capabilities Тип развертывания (доступность региона) Тип проекта
FLUX.2-pro генерация изображений
- API поставщика услуг BFL: <resource-name>/providers/blackforestlabs/v1/flux-2-pro
- Входные данные: текст и изображение (32 000 маркеров и до 8 изображенийi)
- Вывод: Одно изображение
- Вызов инструмента: Нет
- Форматы ответов: Изображение (PNG и JPG)
- Ключевые функции: Поддержка нескольких ссылок для 8 изображенийii, более основанные на реальном знании, большая гибкость выходных данных, улучшенная производительность
- Дополнительные параметры:(Только ДЛЯ API для конкретного поставщика) Поддерживает все параметры.
— глобальный стандарт (все регионы) Литейный завод, централизованный
FLUX.1-Kontext-pro генерация изображений
- API изображений: https://<resource-name>/openai/deployments/{deployment-id}/images/generations
и
https://<resource-name>/openai/deployments/{deployment-id}/images/edits

- API поставщика услуг BFL: <resource-name>/providers/blackforestlabs/v1/flux-kontext-pro?api-version=preview
- Входные данные: текст и изображение (5000 маркеров и 1 изображение)
- Вывод: Одно изображение
- Вызов инструмента: Нет
- Форматы ответов: изображение (PNG и JPG)
- Ключевые функции: Согласованность символов, расширенное редактирование
- Дополнительные параметры:(Только api для конкретного поставщика)seed, aspect ratio, , input_image, prompt_unsampling, safety_toleranceoutput_format
— глобальный стандарт (все регионы) Литейный завод, централизованный
FLUX-1.1-pro генерация изображений
- API изображений: https://<resource-name>/openai/deployments/{deployment-id}/images/generations

- API поставщика услуг BFL: <resource-name>/providers/blackforestlabs/v1/flux-pro-1.1?api-version=preview
- Входные данные: текст (5000 маркеров и 1 изображение)
- Вывод: Одно изображение
- Вызов инструмента: Нет
- Форматы ответов: Изображение (PNG и JPG)
- Ключевые функции: Быстрый вывод, строгое соблюдение запросов, конкурентное ценообразование, масштабируемая генерация
- Дополнительные параметры:(Только api для конкретного поставщика)width, height, , prompt_unsampling, seed, safety_toleranceoutput_format
— глобальный стандарт (все регионы) Литейный завод, централизованный
Модель Тип и конечная точка API Capabilities Тип развертывания (доступность региона)
FLUX.2-pro генерация изображений
- API поставщика услуг BFL: <resource-name>/providers/blackforestlabs/v1/flux-2-pro
- Входные данные: текст (32 000 маркеров и до 8 изображенийi)
- Вывод: Одно изображение
- Вызов инструмента: Нет
- Форматы ответов: Изображение (PNG и JPG)
- Ключевые функции: Поддержка нескольких ссылок для 8 изображенийii, более основанные на реальном знании, большая гибкость выходных данных, улучшенная производительность
- Дополнительные параметры:(Только ДЛЯ API для конкретного поставщика) Поддерживает все параметры.
— глобальный стандарт (все регионы)
FLUX.1-Kontext-pro генерация изображений
- API изображений: https://<resource-name>/openai/deployments/{deployment-id}/images/generations
и
https://<resource-name>/openai/deployments/{deployment-id}/images/edits

- API поставщика услуг BFL: <resource-name>/providers/blackforestlabs/v1/flux-kontext-pro?api-version=preview
- Входные данные: текст и изображение (5000 маркеров и 1 изображение)
- Вывод: Одно изображение
- Вызов инструмента: Нет
- Форматы ответов: Изображение (PNG и JPG)
- Ключевые функции: Согласованность символов, расширенное редактирование
- Дополнительные параметры:(Только api для конкретного поставщика)seed, aspect ratio, , input_image, prompt_unsampling, safety_toleranceoutput_format
— глобальный стандарт (все регионы)
FLUX-1.1-pro генерация изображений
- API изображений: https://<resource-name>/openai/deployments/{deployment-id}/images/generations

- API поставщика услуг BFL: <resource-name>/providers/blackforestlabs/v1/flux-pro-1.1?api-version=preview
- Входные данные: текст (5000 маркеров и 1 изображение)
- Вывод: Одно изображение
- Вызов инструмента: Нет
- Форматы ответов: Изображение (PNG и JPG)
- Ключевые функции: Быстрый вывод, строгое соблюдение запросов, конкурентное ценообразование, масштабируемая генерация
- Дополнительные параметры:(Только api для конкретного поставщика)width, height, , prompt_unsampling, seed, safety_toleranceoutput_format
— глобальный стандарт (все регионы)

i,ii Поддержка нескольких эталонных образов (до восьми) доступна для FLUX.2[pro] с помощью API, но не на детской площадке. См. следующие примеры кода для FLUX.2[pro].

Примеры кода для FLUX.2[pro]

генерация изображений

  • Входные данные: текст
  • Выходные данные: одно изображение
curl -X POST https://<your-resource-name>.api.cognitive.microsoft.com/providers/blackforestlabs/v1/flux-2-pro?api-version… \ 
  -H "Content-Type: application/json" \ 
  -H "Authorization: Bearer {API_KEY}" \ 
  -d '{ 
      "model": "FLUX.2-pro" 
      "prompt": "A photograph of a red fox in an autumn forest", 
      "width": 1024, 
      "height": 1024, 
      "seed": 42, 
      "safety_tolerance": 2, 
      "output_format": "jpeg", 
    }' 

Редактирование изображений

  • Входные данные: до восьми изображений, закодированных в формате 64-битных
  • Выходные данные: одно изображение
curl -X POST https://<your-resource-name>.api.cognitive.microsoft.com/providers/blackforestlabs/v1/flux-2-pro?api-version… \
  -H "Content-Type: application/json" \ 
  -H "Authorization: Bearer {API_KEY}" \ 
  -d '{ 
      "model": "FLUX.2-pro", 
      "prompt": "Apply a cinematic, moody lighting effect to all photos. Make them look like scenes from a sci-fi noir film", 
      "output_format": "jpeg", 
      "input_image" : "/9j/4AAQSkZJRgABAQAAAQABAAD/2wBDA.......", 
      "input_image_2" : "iVBORw0KGgoAAAANSUhEUgAABAAAAAQACAIAAADwf........" 
    }' 

См . эту коллекцию моделей на портале Microsoft Foundry.

Модели Cohere, продаваемые прямо через Azure

Семейство моделей Cohere включает различные модели, оптимизированные для различных вариантов использования, включая завершение чата, переранжирование/классификацию текста и векторные представления. Модели Cohere оптимизированы для различных вариантов использования, включающих причины, сводку и ответы на вопросы.

Модель Тип Capabilities Тип развертывания (доступность региона) Тип проекта
Cohere-rerank-v4.0-pro классификация текста (пересортировка) - Входные данные: текст
- Выходные данные: текст
- Языки:en, fresitdept-brjazh-cnarvi, , hiruidnl
- Вызов инструмента: Нет
- Форматы ответов: JSON
— глобальный стандарт (все регионы)
- Управляемые вычислительные ресурсы
Литейный завод, централизованный
Cohere-rerank-v4.0-fast классификация текста (пересортировка) - Входные данные: текст
- Выходные данные: текст
- Языки:en, fresitdept-brjazh-cnarvi, , hiruidnl
- Вызов инструмента: Нет
- Форматы ответов: JSON
— глобальный стандарт (все регионы)
- Управляемые вычислительные ресурсы
Литейный завод, централизованный
Cohere-command-a chat-completion - Входные данные: текст (131 072 токенов)
- Выходные данные: текст (8 182 токенов)
языки - :en, fr, es, it, de, pt-br, ja, ko, zh-cnи ar
- Вызов инструмента: Да
- Форматы ответов: Текст, JSON
— глобальный стандарт (все регионы) Литейный завод, централизованный
embed-v-4-0 embeddings - Входные данные: текст (512 токенов) и изображения (2MM пикселей)
- Вывод: Вектор (256, 512, 1024, 1536 размерности)
языки - :en, fr, es, it, de, pt-br, ja, ko, zh-cnи ar
— глобальный стандарт (все регионы) Литейный завод, централизованный
Модель Тип Capabilities Тип развертывания (доступность региона)
Cohere-rerank-v4.0-pro классификация текста (пересортировка) - Входные данные: текст
- Выходные данные: текст
- Языки:en, fresitdept-brjazh-cnarvi, , hiruidnl
- Вызов инструмента: Нет
- Форматы ответов: JSON
— глобальный стандарт (все регионы)
— Управляемые вычисления
Cohere-rerank-v4.0-fast классификация текста (пересортировка) - Входные данные: текст
- Выходные данные: текст
- Языки:en, fresitdept-brjazh-cnarvi, , hiruidnl
- Вызов инструмента: Нет
- Форматы ответов: JSON
— глобальный стандарт (все регионы)
— Управляемые вычисления
Cohere-command-a chat-completion - Входные данные: текст (131 072 токенов)
- Выходные данные: текст (8 182 токенов)
языки - :en, fr, es, it, de, pt-br, ja, ko, zh-cnи ar
- Вызов инструмента: Да
- Форматы ответов: Текст, JSON
— глобальный стандарт (все регионы)
embed-v-4-0 embeddings - Входные данные: текст (512 токенов) и изображения (2MM пикселей)
- Вывод: Вектор (256, 512, 1024, 1536 размерности)
языки - :en, fr, es, it, de, pt-br, ja, ko, zh-cnи ar
— глобальный стандарт (все регионы)

См. коллекцию моделей Cohere на портале Foundry.

Модели DeepSeek, продаваемые напрямую компанией Azure

Семейство моделей DeepSeek включает в себя несколько моделей рассуждений, которые превосходно справляются с задачами на рассуждение благодаря пошаговому процессу обучения, таким как языковые, научные рассуждения и программирование.

Модель Тип Capabilities Тип развертывания (доступность региона) Тип проекта
DeepSeek-V3.2-Speciale chat-completion
(с обоснованием)
- Входные данные: текст (128 000 токенов)
- Выходные данные: (128 000 токенов)
- Языки:en и zh
- Вызов инструмента: Нет
- Форматы ответов: Текст, JSON
— глобальный стандарт (все регионы) Литейный завод, централизованный
DeepSeek-V3.2 chat-completion
(с обоснованием)
- Входные данные: текст (128 000 токенов)
- Выходные данные: (128 000 токенов)
- Языки:en и zh
- Вызов инструмента: Нет
- Форматы ответов: Текст, JSON
— глобальный стандарт (все регионы) Литейный завод, централизованный
DeepSeek-V3.1 chat-completion
(с обоснованием)
- Входные данные: текст (131 072 токенов)
- выходные данные: (131 072 токенов)
- Языки:en и zh
- Вызов инструмента: Да
- Форматы ответов: Текст, JSON
— глобальный стандарт (все регионы) Литейный завод, централизованный
DeepSeek-R1-0528 chat-completion
(с обоснованием)
- Входные данные: текст (163 840 токенов)
- Выходные данные: (163 840 токенов)
- Языки:en и zh
- Вызов инструмента: Нет
- Форматы ответов: текст.
— глобальный стандарт (все регионы)
— глобальные подготовленные (все регионы)
Литейный завод, централизованный
DeepSeek-V3-0324 chat-completion - Входные данные: текст (131 072 токенов)
- выходные данные: (131 072 токенов)
- Языки:en и zh
- Вызов инструмента: Да
- Форматы ответов: Текст, JSON
— глобальный стандарт (все регионы)
— глобальные подготовленные (все регионы)
Литейный завод, централизованный
DeepSeek-R1 chat-completion
(с обоснованием)
- Входные данные: текст (163 840 токенов)
- Выходные данные: (163 840 токенов)
- Языки:en и zh
- Вызов инструмента: Нет
- Форматы ответов: текст.
— глобальный стандарт (все регионы)
— глобальные подготовленные (все регионы)
Литейный завод, централизованный
Модель Тип Capabilities Тип развертывания (доступность региона)
DeepSeek-V3.2-Speciale chat-completion
(с обоснованием)
- Входные данные: текст (128 000 токенов)
- Выходные данные: (128 000 токенов)
- Языки:en и zh
- Вызов инструмента: Нет
- Форматы ответов: Текст, JSON
— глобальный стандарт (все регионы)
DeepSeek-V3.2 chat-completion
(с обоснованием)
- Входные данные: текст (128 000 токенов)
- Выходные данные: (128 000 токенов)
- Языки:en и zh
- Вызов инструмента: Нет
- Форматы ответов: Текст, JSON
— глобальный стандарт (все регионы)
DeepSeek-V3.1 chat-completion
(с обоснованием)
- Входные данные: текст (131 072 токенов)
- выходные данные: (131 072 токенов)
- Языки:en и zh
- Вызов инструмента: Да
- Форматы ответов: Текст, JSON
— глобальный стандарт (все регионы)
DeepSeek-R1-0528 chat-completion
(с обоснованием)
- Входные данные: текст (163 840 токенов)
- Выходные данные: (163 840 токенов)
- Языки:en и zh
- Вызов инструмента: Нет
- Форматы ответов: текст.
— глобальный стандарт (все регионы)
— глобальные подготовленные (все регионы)
DeepSeek-V3-0324 chat-completion - Входные данные: текст (131 072 токенов)
- выходные данные: (131 072 токенов)
- Языки:en и zh
- Вызов инструмента: Да
- Форматы ответов: Текст, JSON
— глобальный стандарт (все регионы)
— глобальные подготовленные (все регионы)
DeepSeek-R1 chat-completion
(с обоснованием)
- Входные данные: текст (163 840 токенов)
- Выходные данные: (163 840 токенов)
- Языки:en и zh
- Вызов инструмента: Нет
- Форматы ответов: текст.
— глобальный стандарт (все регионы)
— глобальные подготовленные (все регионы)

См . эту коллекцию моделей на портале Foundry.

Метамодели, продаваемые напрямую Azure

Модели и инструменты Meta Llama — это коллекция предварительно обученных и точно настроенных генеративных моделей ИИ для работы с текстами и изображениями. Диапазон метаданных моделей в масштабе для включения:

  • Небольшие языковые модели (SLM), такие как 1B и 3B Base и модели Instruct, для вывода на устройствах и выводов на периферии.
  • Средние крупные языковые модели (LLMs), такие как 7B, 8B и 70B Base и модели Instruct
  • Высокопроизводительные модели, такие как Meta Llama 3.1-405B, инструктируют для создания искусственных данных и вариантов использования дистилляции.
Модель Тип Capabilities Тип развертывания (доступность региона) Тип проекта
Llama-4-Maverick-17B-128E-Instruct-FP8 chat-completion - Входные данные: текст и изображения (маркеры 1M)
- Выходные данные: текст (1 млн токенов)
- Языки:ar, enfrdehiiditptes, и tlthvi
- Вызов инструмента: Нет
- Форматы ответов: текст
— глобальный стандарт (все регионы) Литейный завод, централизованный
Llama-3.3-70B-Instruct chat-completion - Входные данные: текст (128 000 токенов)
- Выходные данные: текст (8 192 токенов)
языки - :en, de, fr, it, pt, hi, esи th
- Вызов инструмента: Нет
- Форматы ответов: текст
— глобальный стандарт (все регионы) Литейный завод, централизованный
Модель Тип Capabilities Тип развертывания (доступность региона)
Llama-4-Maverick-17B-128E-Instruct-FP8 chat-completion - Входные данные: текст и изображения (маркеры 1M)
- Выходные данные: текст (1 млн токенов)
- Языки:ar, enfrdehiiditptes, и tlthvi
- Вызов инструмента: Нет
- Форматы ответов: текст
— глобальный стандарт (все регионы)
Llama-3.3-70B-Instruct chat-completion - Входные данные: текст (128 000 токенов)
- Выходные данные: текст (8 192 токенов)
языки - :en, de, fr, it, pt, hi, esи th
- Вызов инструмента: Нет
- Форматы ответов: текст
— глобальный стандарт (все регионы)

См . эту коллекцию моделей на портале Foundry. Вы также можете найти несколько метамодели, доступные от партнеров и сообщества.

Модели Майкрософт, проданные непосредственно Azure

Модели Майкрософт включают различные группы моделей, такие как маршрутизатор модели, модели MAI, модели Phi, модели для здравоохранения и многое другое. См . коллекцию моделей Майкрософт на портале Foundry. Вы также можете найти несколько моделей Майкрософт, доступных от партнеров и сообщества.

Модель Тип Capabilities Тип развертывания (доступность региона) Тип проекта
модель роутера1 chat-completion Дополнительные сведения см. в обзоре маршрутизатора модели.
- Входные данные: текст, изображение
- Выходные данные: текст (максимальное количество выходных токенов варьируется2)
Окно контекста: 200 0003
- Языки:en
- Глобальный стандарт (восточная часть США 2, Центральная Швеция)
— Зона данных стандарта4 (восточная часть США 2, Центральная Швеция)
Литейный завод, централизованный
MAI-DS-R1 chat-completion
(с обоснованием)
- Входные данные: текст (163 840 токенов)
- Выходные данные: (163 840 токенов)
- Языки:en и zh
- Вызов инструмента: Нет
- Форматы ответов: текст.
— глобальный стандарт (все регионы) Литейный завод, централизованный
Модель Тип Capabilities Тип развертывания (доступность региона)
модель роутера1 chat-completion Дополнительные сведения см. в обзоре маршрутизатора модели.
- Входные данные: текст, изображение
- Выходные данные: текст (максимальное количество выходных токенов варьируется2)
Окно контекста: 200 0003
- Языки:en
- Глобальный стандарт (восточная часть США 2, Центральная Швеция)
— Зона данных стандарта4 (восточная часть США 2, Центральная Швеция)
MAI-DS-R1 chat-completion
(с обоснованием)
- Входные данные: текст (163 840 токенов)
- Выходные данные: (163 840 токенов)
- Языки:en и zh
- Вызов инструмента: Нет
- Форматы ответов: текст.
— глобальный стандарт (все регионы)

1Версия маршрутизатора2025-11-18. Более ранние версии (2025-08-07 и 2025-05-19) также доступны.

2Максимальное количество токенов на выходе зависит от базовых моделей в маршрутизаторе модели. Например, 32 768 (), 100 000 (GPT-4.1 series), 128 000 (o4-minigpt-5 reasoning models) и 16 384 (gpt-5-chat).

3 Более крупные контекстные окна совместимы с некоторыми базовыми моделями маршрутизатора модели. Это означает, что вызов API с большим контекстом завершается успешно, только если запрос перенаправляется в одну из таких моделей. В противном случае вызов завершается ошибкой.

4 Выставление счетов за развертывание маршрутизаторов модели "Стандартный" для зоны данных начинается не раньше 1 ноября 2025 г.

Мистральные модели, проданные непосредственно Azure

Модель Тип Capabilities Тип развертывания (доступность региона) Тип проекта
Мистраль-Большой-3 chat-completion - Входные данные: текст, изображение
- Выходные данные: текст
языки - :en, fr, de, es, it, pt, nl, zh, ja, koи ar
- Вызов инструмента: Да
- Форматы ответов: Текст, JSON
- Глобальный стандарт (западная часть США 3) Литейный завод
mistral-document-ai-2505 Изображение к тексту - Входные данные: изображения или PDF-страницы (30 страниц, максимум 30 МБ PDF-файла)
- Выходные данные: текст
- Языки:en
- Вызов инструмента: нет
- Форматы ответов: Текст, JSON, Markdown
— глобальный стандарт (все регионы)
— стандарт зоны данных (США и ЕС)
Литейный завод
Модель Тип Capabilities Тип развертывания (доступность региона)
Mistral-Large-3 chat-completion - Входные данные: текст, изображение
- Выходные данные: текст
языки - :en, fr, de, es, it, pt, nl, zh, ja, koи ar
- Вызов инструмента: Да
- Форматы ответов: Текст, JSON
- Глобальный стандарт (западная часть США 3)
mistral-document-ai-2505 Изображение к тексту - Входные данные: изображения или PDF-страницы (30 страниц, максимум 30 МБ PDF-файла)
- Выходные данные: текст
- Языки:en
- Вызов инструмента: нет
- Форматы ответов: Текст, JSON, Markdown
— глобальный стандарт (все регионы)
— стандарт зоны данных (США и ЕС)

См. коллекцию моделей Mistral на портале Foundry. Вы также можете найти несколько моделей Мистраля , доступных от партнеров и сообщества.

Модели ИИ Moonshot, проданные непосредственно в Azure

Модели Moonshot AI включают Кими K2 Thinking, последнюю, самую способную версию модели мышления с открытым исходным кодом. Кими K2 был построен как агент мышления, который рассуждает пошагово, в то время как динамически вызывает инструменты. Он ставит новый стандарт на Экзамене на выживание человечества (HLE), BrowseComp и других тестах, благодаря значительному увеличению глубины многошагового рассуждения и поддержанию стабильного использования инструментов в течение 200–300 вызовов один за другим.

Ключевые возможности системы Kimi K2 Thinking включают:

  • Оркестрация глубокого мышления и инструментов: Сквозное обучение, позволяющее чередовать логические цепочки с вызовами функций, создавая условия для автономного проведения исследований, программирования и написания, что обеспечивает выполнение сотен шагов без отклонений.
  • Собственная INT4 квантизация: Обучение с учетом квантизации (QAT) используется на этапе после обучения, чтобы достичь двукратного увеличения скорости без потерь в режиме низкой задержки.
  • Стабильное управление с длинным горизонтом: Поддерживает согласованное поведение, направленное на цель, до 200–300 последовательных вызовов инструментария, превосходя предыдущие модели, которые деградируют после 30–50 шагов.
Модель Тип Capabilities Тип развертывания (доступность региона) Тип проекта
Kimi-K2-Thinking chat-completion
(с обоснованием)
- Входные данные: текст (262 144 токена)
- Выходные данные: текст (262 144 токена)
- Языки:en и zh
- Вызов инструмента: Да
- Форматы ответов: текст
— глобальный стандарт (все регионы) Литейный завод, централизованный
Модель Тип Capabilities Тип развертывания (доступность региона)
Kimi-K2-Thinking chat-completion
(с обоснованием)
- Входные данные: текст (262 144 токена)
- Выходные данные: текст (262 144 токена)
- Языки:en и zh
- Вызов инструмента: Да
- Форматы ответов: текст
— глобальный стандарт (все регионы)

См . эту коллекцию моделей на портале Foundry.

Модели xAI, проданные непосредственно Azure

Модели Grok xAI в Foundry Models включают разнообразный набор моделей, предназначенных для достижения выдающихся результатов в различных корпоративных сферах, с различными возможностями и ценовыми точками, в том числе:

  • Grok 3, модель без рассуждения, предварительно обученная в центре обработки данных Colossus, адаптирована для бизнес-решений, таких как извлечение данных, кодирование и текстовое резюмирование, с исключительными возможностями следования инструкциям. Он поддерживает контекстное окно размером 131 072 токена, позволяя ему обрабатывать обширные входные данные при сохранении согласованности и глубины, а также подходит для установления связей между доменами и языками.

  • Grok 3 Mini — это упрощенная модель логики, обученная решать агентические, кодирование, математические и глубокие проблемы с вычислениями во время тестирования. Он также поддерживает контекстное окно из 131 072 токенов для понимания исходных кодов и корпоративных документов, и превосходно использует средства для решения сложных логических проблем в новых средах, предлагая пользователям необработанные трассировки рассуждений для ознакомления с регулируемыми ресурсами для размышлений.

  • Grok Code Fast 1— быстрая и эффективная модель рассудок, предназначенная для использования в приложениях для программирования агентов. Он был предварительно обучен на смеси данных, ориентированной на код, а затем дообучен на демонстрациях различных программировочных задач, использования инструментов, а также демонстрациях корректного отказа на основе политики безопасности xAI. Регистрация необходима для доступа к модели grok-code-fast-1.

  • Grok 4 Fast, оптимизированная для эффективности языковая модель, которая обеспечивает возможности рассуждения, близкие к Grok 4, с значительно меньшей задержкой и затратами, и может полностью обходить рассуждения для сверхбыстрых приложений. Он обучен для безопасного и эффективного использования инструментов с встроенными поведениями отказа, фиксированным запросом системы обеспечения безопасности и фильтрами ввода, чтобы предотвратить неправильное использование.

  • Grok 4 — это последняя модель рассуждений из xAI с расширенными возможностями разработки и использования инструментов, что позволяет достичь нового состояния производительности в сложных академических и отраслевых тестах. Регистрация требуется для доступа к модели grok-4. В отличие от моделей Grok 4 Fast (логических и нелогических), Grok 4 не поддерживает вход изображений.

Модель Тип Capabilities Тип развертывания (доступность региона) Тип проекта
grok-4 chat-completion - Входные данные: текст (256 000 маркеров)
- Выходные данные: текст (8 192 токенов)
- Языки:en
- Вызов инструмента: да
- Форматы ответов: текст
— глобальный стандарт (все регионы) Литейный завод, централизованный
grok-4-fast-reasoning chat-completion - Входные данные: текст, изображение (2 000 000 токенов)
- Выходные данные: текст (2 000 000 маркеров)
- Языки:en
- Вызов инструмента: да
- Форматы ответов: текст
— глобальный стандарт (все регионы)
— стандарт зоны данных (США)
Литейный завод, централизованный
грок-4-быстро-без-рассуждений chat-completion - Входные данные: текст, изображение (2 000 000 токенов)
- Выходные данные: текст (2 000 000 маркеров)
- Языки:en
- Вызов инструмента: да
- Форматы ответов: текст
— глобальный стандарт (все регионы)
— стандарт зоны данных (США)
Литейный завод, централизованный
grok-code-fast-1 chat-completion - Входные данные: текст (256 000 маркеров)
- Выходные данные: текст (8 192 токенов)
- Языки:en
- Вызов инструмента: да
- Форматы ответов: текст
— глобальный стандарт (все регионы) Литейный завод, централизованный
grok-3 chat-completion - Входные данные: текст (131 072 токенов)
- Выходные данные: текст (131 072 токенов)
- Языки:en
- Вызов инструмента: да
- Форматы ответов: текст
— глобальный стандарт (все регионы)
— стандарт зоны данных (США)
Литейный завод, централизованный
grok-3-mini chat-completion - Входные данные: текст (131 072 токенов)
- Выходные данные: текст (131 072 токенов)
- Языки:en
- Вызов инструмента: да
- Форматы ответов: текст
— глобальный стандарт (все регионы)
— стандарт зоны данных (США)
Литейный завод, централизованный
Модель Тип Capabilities Тип развертывания (доступность региона)
grok-4 chat-completion - Входные данные: текст, изображение (256 000 токенов)
- Выходные данные: текст (8 192 токенов)
- Языки:en
- Вызов инструмента: да
- Форматы ответов: текст
— глобальный стандарт (все регионы)
grok-4-fast-reasoning chat-completion - Входные данные: текст, изображение (2 000 000 токенов)
- Выходные данные: текст (2 000 000 маркеров)
- Языки:en
- Вызов инструмента: да
- Форматы ответов: текст
— глобальный стандарт (все регионы)
— стандарт зоны данных (США)
grok-4-fast-non-reasoning chat-completion - Входные данные: текст, изображение (2 000 000 токенов)
- Выходные данные: текст (2 000 000 маркеров)
- Языки:en
- Вызов инструмента: да
- Форматы ответов: текст
— глобальный стандарт (все регионы)
— стандарт зоны данных (США)
grok-code-fast-1 chat-completion - Входные данные: текст (256 000 маркеров)
- Выходные данные: текст (8 192 токенов)
- Языки:en
- Вызов инструмента: да
- Форматы ответов: текст
— глобальный стандарт (все регионы)
grok-3 chat-completion - Входные данные: текст (131 072 токенов)
- Выходные данные: текст (131 072 токенов)
- Языки:en
- Вызов инструмента: да
- Форматы ответов: текст
— глобальный стандарт (все регионы)
— стандарт зоны данных (США)
grok-3-mini chat-completion - Входные данные: текст (131 072 токенов)
- Выходные данные: текст (131 072 токенов)
- Языки:en
- Вызов инструмента: да
- Форматы ответов: текст
— глобальный стандарт (все регионы)
— стандарт зоны данных (США)

См . коллекцию моделей xAI на портале Foundry.

Доступность региона модели по типу развертывания

Модели Foundry позволяют выбрать структуру размещения, которая соответствует вашим бизнес-шаблонам и шаблонам использования. Служба предлагает два основных типа развертывания:

  • Стандарт: имеет глобальный вариант развертывания, маршрутизация трафика глобально для обеспечения более высокой пропускной способности.
  • Резервированный: также имеет вариант глобального развертывания, позволяющий приобрести и развернуть резервированные единицы пропускной способности в глобальной инфраструктуре Azure.

Все развертывания выполняют одни и те же операции вывода, но выставление счетов, масштабирование и производительность отличаются. Дополнительные сведения о типах развертывания см. в разделе "Типы развертывания" в модели Foundry.

Доступность глобальной модели уровня "Стандартный"

Регион DeepSeek-R1-0528 DeepSeek-R1 DeepSeek-V3-0324 DeepSeek-V3.1 FLUX.1-Kontext-pro FLUX-1.1-pro grok-4 grok-4-fast-reasoning грок-4-быстро-без-рассуждений grok-code-fast-1 grok-3 grok-3-mini Llama-4-Maverick-17B-128E-Instruct-FP8 Llama-3.3-70B-Instruct MAI-DS-R1 mistral-document-ai-2505
австралиявосток
Бразильский Юг
Канада Восток
Истус
eastus2
francecentral
Германия-запад-центр
северная италия
japaneast
koreacentral
northcentralus
Норвегия Восток
Польша Центральная
Южная Африка-север
СаутЦентралус
Южная Индия
spaincentral
SwedenCentral
Швейцария север
switzerlandwest
uaenorth
UKSOUTH
Западная Европа
Вестус
westus3

Открытые и настраиваемые модели

Каталог моделей предлагает более широкий выбор моделей из более широкого диапазона поставщиков. Для этих моделей нельзя использовать параметр стандартного развертывания в ресурсах Microsoft Foundry, где модели предоставляются как API. Вместо этого для развертывания этих моделей может потребоваться разместить их в инфраструктуре, создать концентратор ИИ и предоставить базовую квоту вычислений для размещения моделей.

Кроме того, эти модели могут быть защищены открытым доступом или IP-адресом. В обоих случаях их необходимо развернуть в управляемых вычислительных предложениях в Foundry. Сведения о начале работы см. в статье "Практическое руководство. Развертывание в управляемых вычислительных ресурсах".