Модели Foundry продаются непосредственно через Azure в Azure для государственных организаций.

В этой статье перечислены некоторые модели Microsoft Foundry, проданные непосредственно Azure для Azure для государственных организаций, вместе с их возможностями, типами развертывания и регионами доступности.

Модели, продаваемые непосредственно Azure, включают все модели Azure OpenAI, предлагаемые в Azure для государственных организаций. Эти модели оплачиваются через подписку Azure, покрываются соглашениями об уровне обслуживания Azure и поддерживаются Microsoft.

Дополнительные сведения об атрибутах всех моделей Foundry, проданных непосредственно Azure во всех облаках, см. в разделе Models, проданные напрямую Azure.

Azure OpenAI в моделях Microsoft Foundry в Azure для государственных организаций

Azure OpenAI работает с различным набором моделей с разными возможностями и ценовыми точками. Доступность модели в Azure для государственных организаций зависит от региона.

Модели Описание
Серия GPT-5.1 Новые функцииgpt-5.1
Серия GPT-4.1 gpt-4.1, gpt-4.1-mini
модели o-серии Модели рассуждений с расширенным решением проблем и повышением фокуса и возможностей.
GPT-4o Способные модели Azure OpenAI с многомодальными версиями, которые могут принимать как текст, так и изображения в качестве входных данных.
Внедрение Набор моделей, которые могут преобразовывать текст в числовую векторную форму для определения сходства текста.

GPT-5.1

Доступность региона

Модель Регион
gpt-5.1 См. таблицу моделей.
Идентификатор модели Описание Окно контекста Максимум выходных токенов Учебные данные (до указанного предела)
gpt-5.1 (2025-11-13) - Рассуждения
— API завершения чата.
- API ответов.
— структурированные выходные данные.
— Обработка текста и изображения.
— Функции, инструменты и параллельные вызовы инструментов.
- Полная сводка возможностей.
400,000

Входные данные: 272 000
Выходные данные: 128 000
128,000 30 сентября 2024 г.

Важно

  • gpt-5.1 reasoning_effort по умолчанию принимает значение none. При обновлении предыдущих моделей рассуждений на gpt-5.1, необходимо помнить, что для обновления кода может потребоваться явная передача уровня reasoning_effort, если необходимо выполнение рассуждения.

Серия GPT-4.1

Доступность региона

Модель Регион
gpt-4.1 (2025-04-14) См. таблицу моделей.
gpt-4.1-mini (2025-04-14) См. таблицу моделей.

Возможности

Важно

Известная проблема влияет на все модели серии GPT 4.1. Крупные определения вызовов инструментов или функций, превышающие 300 000 токенов, приводят к сбоям, даже если предел контекста модели в 1 миллион токенов не достигнут.

Ошибки могут отличаться на основе вызовов API и базовых характеристик полезных данных.

Ниже приведены сообщения об ошибках ДЛЯ API завершения чата:

  • Error code: 400 - {'error': {'message': "This model's maximum context length is 300000 tokens. However, your messages resulted in 350564 tokens (100 in the messages, 350464 in the functions). Please reduce the length of the messages or functions.", 'type': 'invalid_request_error', 'param': 'messages', 'code': 'context_length_exceeded'}}

  • Error code: 400 - {'error': {'message': "Invalid 'tools[0].function.description': string too long. Expected a string with maximum length 1048576, but got a string with length 2778531 instead.", 'type': 'invalid_request_error', 'param': 'tools[0].function.description', 'code': 'string_above_max_length'}}

Ниже приведено сообщение об ошибке ДЛЯ API ответов:

  • Error code: 500 - {'error': {'message': 'The server had an error processing your request. Sorry about that! You can retry your request, or contact us through an Azure support request at: https://go.microsoft.com/fwlink/?linkid=2213926 if you keep seeing this error. (Please include the request ID d2008353-291d-428f-adc1-defb5d9fb109 in your email.)', 'type': 'server_error', 'param': None, 'code': None}}
Идентификатор модели Описание Окно контекста Максимальное количество выходных токенов Обучающие данные (до определённого момента)
gpt-4.1 (2025-04-14) — ввод текста и изображения
— вывод текста
— API завершения чата
— API ответов
- Стриминг
— Вызов функции
— структурированные выходные данные (завершение чата)
- 1 047 576 (недоступно)
— 128 000 (стандартные и подготовленные управляемые развертывания)
— 300 000 (пакетные развертывания)
32,768 31 мая 2024 г.
gpt-4.1-mini (2025-04-14) — ввод текста и изображения
— вывод текста
— API завершения чата
— API ответов
- Стриминг
— Вызов функции
— структурированные выходные данные (завершение чата)
- 1 047 576 (недоступно)
— 128 000 (стандартные и подготовленные управляемые развертывания)
— 300 000 (пакетные развертывания)
32,768 31 мая 2024 г.

модели o-серии

Модели серии Azure OpenAI o-серии предназначены для решения задач с повышенной концентрацией и расширенными возможностями. Эти модели тратят больше времени на обработку и понимание запроса пользователя, что делает их исключительно сильными в таких областях, как наука, программирование и математика, по сравнению с предыдущими итерациями.

Идентификатор модели Описание Максимальное количество запросов (токен) Обучающие данные (до определённого момента)
o3-mini (2025-01-31) - Расширенные способности рассудка.
— структурированные выходные данные.
обработка исключительно текста.
— Функции и инструменты.
Входные данные: 200 000
Выходные данные: 100 000
Октябрь 2023 г.

Дополнительные сведения о расширенных моделях серии o см. в статье "Начало работы с моделями причин".

Доступность региона

Модель Регион
o3-mini См. таблицу моделей.

GPT-4o

GPT-4o интегрирует текст и изображения в одну модель, что позволяет одновременно обрабатывать несколько типов данных. Этот многомодальный подход повышает точность и скорость реагирования на взаимодействие с компьютером. GPT-4o соответствует GPT-4 Turbo в задачах английского текста и программирования, обеспечивая более высокую производительность в задачах, отличных от английского языка, и задачах визуального зрения, устанавливая новые тесты для возможностей искусственного интеллекта.

Идентификатор модели Описание Максимальное количество запросов (токен) Обучающие данные (до определённого момента)
gpt-4o (2024-11-20)
GPT-4o (Omni)
— структурированные выходные данные.
— Обработка текста и изображения.
— режим JSON.
параллельный вызов функций.
— улучшенная точность и скорость реагирования.
— Сопоставимость с английским текстом и задачами программирования в сравнении с GPT-4 Turbo с Vision.
— высокая производительность на языках, отличных от английского языка, и в задачах визуального зрения.
- Улучшенные творческие способности писать.
Входные данные: 128 000
Выходные данные: 16 384
Октябрь 2023 г.

Эмбеддинги

text-embedding-3-large является последней и самой способной моделью внедрения. Вы не можете выполнить обновление между моделями эмбеддингов. Чтобы перейти с использования text-embedding-ada-002 на text-embedding-3-large, необходимо создать новые встраивания.

  • text-embedding-3-large
  • text-embedding-3-small
  • text-embedding-ada-002

OpenAI сообщает, что тестирование показывает, что как крупные, так и небольшие эмбеддинг-модели третьего поколения обеспечивают более высокую среднюю производительность при многоязычном извлечении с помощью теста MIRACL. Они по-прежнему поддерживают производительность для английских задач с помощью теста MTEB .

Эталон оценки text-embedding-ada-002 text-embedding-3-small text-embedding-3-large
Среднее значение MIRACL 31.4 44.0 54.9
Среднее значение MTEB 61.0 62.3 64.6

Модели внедрения третьего поколения поддерживают уменьшение размера внедрения с помощью нового dimensions параметра. Как правило, более крупные внедрения являются более дорогими с точки зрения вычислений, памяти и хранилища. При настройке количества измерений вы получаете больше контроля над общими затратами и производительностью. Параметр dimensions не поддерживается во всех версиях библиотеки openAI 1.x Python. Чтобы воспользоваться этим параметром, рекомендуется обновить до последней версии: pip install openai --upgrade

Тестирование тестов MTEB в OpenAI показало, что даже если размеры модели третьего text-embeddings-ada-002поколения сокращаются до меньше 1536 измерений, производительность остается немного лучше.

Таблица сводки по модели и доступность в регионе

Модели по типу развертывания

Azure OpenAI предоставляет клиентам выбор в структуре размещения, которая соответствует своим бизнес-шаблонам и шаблонам использования. Служба предлагает два основных типа развертывания:

  • Standard: имеет опцию развертывания зоны данных USGov, маршрутизируя трафик внутри Azure для государственных организаций для обеспечения более высокой пропускной способности.
  • Provisioned: также имеет опцию развертывания Datazone, позволяя клиентам приобретать и развертывать предоставленные единицы пропускной способности в инфраструктуре Azure для государственных организаций.

Все развертывания могут выполнять те же операции вывода, но выставление счетов, масштабирование и производительность существенно отличаются. Чтобы узнать больше о типах развертывания Microsoft Azure OpenAI, см. наше руководство по типам развертывания.

Доступность модели уровня "Стандартный" для зоны данных

Регион gpt-5.1, 2025-11-13 gpt-4.1, 2025-04-14 gpt-4.1-mini, 2025-04-14 o3-mini, 2025-01-31 gpt-4o, 2024-11-20 text-embedding-ada-002, 2 text-embedding-3-large, 1 text-embedding-3-small, 1
usgovarizona - - -
usgovvirginia - - -

Модели внедрения

Эти модели можно использовать только с запросами API внедрения.

Примечание

text-embedding-3-large является последней и самой способной моделью внедрения. Невозможно обновить с одной модели внедрения на другую. Чтобы выполнить миграцию с использования text-embedding-ada-002 на text-embedding-3-large, необходимо создать новые встраивания.

Идентификатор модели Максимальное количество запросов (токен) Измерения выходных данных Обучающие данные (до определённого момента)
text-embedding-ada-002 (версия 2) 8,192 1,536 Сентябрь 2021 г.
text-embedding-ada-002 (версия 1) 2,046 1,536 Сентябрь 2021 г.
text-embedding-3-large 8,192 3,072 Сентябрь 2021 г.
text-embedding-3-small 8,192 1,536 Сентябрь 2021 г.

Примечание

При отправке массива входных данных для внедрения максимальное количество входных элементов в массиве на вызов конечной точки внедрения составляет 2048.

Вывод модели из эксплуатации

В некоторых случаях модели выводятся из эксплуатации в Azure для государственных организаций раньше или позже, чем в коммерческом облаке. Последние сведения о выводе модели из эксплуатации см. в руководстве по выводу модели из эксплуатации.