Поделиться через


Модели Службы Azure OpenAI

Служба Azure OpenAI работает на платформе разнообразного набора моделей с разными возможностями и ценовыми категориями. Доступность модели зависит от региона и облака. Сведения о доступности модели для Azure для государственных организаций см. в службе OpenAI для Azure для государственных организаций.

Модели Описание
Серия GPT-4.1 Последняя версия модели из Azure OpenAI
предварительный просмотр использования компьютера Экспериментальная модель, обученная для использования с инструментом API Responses для работы с компьютером.
Предварительная версия GPT-4.5 Последняя модель GPT, которая превосходно справляется с разнообразными задачами по работе с текстом и изображениями.
модели o-серии Модели рассуждения с расширенной способностью решать задачи и повышенным вниманием и способностями.
GPT-4o & GPT-4o mini & GPT-4 Turbo Последние модели Azure OpenAI с многомодальными версиями, которые могут принимать как текст, так и изображения в качестве входных данных.
GPT-4 Набор моделей, которые улучшают GPT-3.5 и могут понимать и создавать естественный язык и код.
GPT-3.5 Набор моделей, которые улучшают GPT-3 и могут понимать и создавать естественный язык и код.
Внедрение Набор моделей, способных преобразовывать текст в числовую векторную форму для обеспечения сходства текстов.
DALL-E Серия моделей, которые могут создавать исходные изображения на естественном языке.
Звук: Серия моделей для преобразования речи в текст, перевод и текст в речь. Звуковые модели GPT-4o поддерживают либо с низкой задержкой, "ввод речи, вывод речи" разговорные взаимодействия, либо генерацию аудио.

Серия GPT 4.1

Доступность по регионам

Модель Область/регион
gpt-4.1 (2025-04-14) Восточная часть США2 (глобальный стандарт), Центральная Швеция (глобальный стандарт)
gpt-4.1-nano (2025-04-14) Восточная часть США2 (глобальный стандарт), Центральная Швеция (глобальный стандарт)
gpt-4.1-mini (2025-04-14) Восточная часть США2 (глобальный стандарт), Центральная Швеция (глобальный стандарт)

Возможности

Идентификатор модели Описание Окно контекста Максимальное количество выходных токенов Учебные данные (вплоть до)
gpt-4.1 (2025-04-14) — ввод текста и изображения
— вывод текста
— API завершения чата
— API ответов
- Потоковое воспроизведение
— Вызов функции
Структурированные выходные данные (завершение чата)
1,047,576 32,768 31 мая 2024 г.
gpt-4.1-nano (2025-04-14)

Быстрая модель 4.1
— ввод текста и изображения
— вывод текста
— API завершения чата
— API ответов
- Потоковое воспроизведение
— Вызов функции
Структурированные выходные данные (завершение чата)
1,047,576 32,768 31 мая 2024 г.
gpt-4.1-mini (2025-04-14) — ввод текста и изображения
— вывод текста
— API завершения чата
— API ответов
- Потоковое воспроизведение
— Вызов функции
Структурированные выходные данные (завершение чата)
1,047,576 32,768 31 мая 2024 г.

предварительный просмотр использования компьютера

Экспериментальная модель, обученная для использования с инструментом API ответов. Его можно использовать в сочетании с 3-сторонними библиотеками, чтобы позволить модели управлять вводом мыши и клавиатуры при получении контекста из снимков экрана текущей среды.

Внимание

Мы не рекомендуем использовать предварительные версии моделей в рабочей среде. Мы обновим все предварительные модели до будущих версий или до последней стабильной версии. Модели, назначенные предварительной версией, не соответствуют стандартному жизненному циклу модели Azure OpenAI.

Доступность

Для доступа к computer-use-preview требуется регистрация, и доступ будет предоставлен на основе критериев приемлемости корпорации Майкрософт. Клиентам, имеющим доступ к другим моделям ограниченного доступа, по-прежнему потребуется запросить доступ к этой модели.

Запрос доступа: computer-use-preview приложение модели ограниченного доступа

После предоставления доступа необходимо создать деплоймент для модели.

Доступность по регионам

Модель Область/регион
computer-use-preview Восток США 2 (Глобальный стандарт)
Южная Индия (глобальный стандарт)
Центральная Швеция (глобальный стандарт)

Возможности

Идентификатор модели Описание Окно контекста Максимальное количество выходных токенов Учебные данные (вплоть до)
computer-use-preview (2025-03-11) Специализированная модель для использования с инструментом API ответов

-Инструменты
-Стриминг
-Text(input/output)
— Изображение(ввод)
8,192 1,024 Октябрь 2023 г.

Предварительная версия GPT-4.5

Доступность по регионам

Модель Область/регион
gpt-4.5-preview Восток США 2 (Глобальный стандарт)
Центральная Швеция (глобальный стандарт)

Возможности

Идентификатор модели Описание Окно контекста Максимальное количество выходных токенов Учебные данные (вплоть до)
gpt-4.5-preview (2025-02-27)
Предварительная версия GPT-4.5
GPT 4.1 является рекомендуемой заменой для этой модели. Отличается высокой эффективностью в работе с различными текстовыми и графическими задачами.
-Структурированные выходные данные
-Кэширование запросов
-Инструменты
-Стриминг
-Text(input/output)
— Изображение(ввод)
128 000 16,384 Октябрь 2023 г.

Примечание.

Ожидается, что модель не может ответить на вопросы о себе. Если вы хотите узнать, когда были установлены ограничения на данные обучения модели, или получить другие сведения о модели, обратитесь к документации модели выше.

модели o-серии

Модели серии Azure OpenAI* специально разработаны для решения задач логического мышления и поиска решений с улучшенными возможностями и повышенной сосредоточенностью. Эти модели тратят больше времени на обработку и понимание запроса пользователя, что делает их исключительно сильными в таких областях, как наука, программирование и математика по сравнению с предыдущими итерациями.

Идентификатор модели Описание Максимальное количество запросов (токены) Учебные данные (вплоть до)
o4-mini (2025-04-16) - НОВАЯ модель рассуждений, предлагающая расширенные возможности аргументирования.

— API завершения чата
- API ответов
— структурированные выходные данные
— Текст, обработка изображений
— Функции/инструменты и вызов параллельных инструментов
Полная сводка возможностей
Входные данные: 200 000
Вывод: 100 000
31 мая 2024 г.
o3 (2025-04-16) - НОВАЯ модель рассуждений, предлагающая расширенные возможности аргументирования.

— API завершения чата
- API ответов
— структурированные выходные данные
— Текст, обработка изображений
— Функции/инструменты и вызов параллельных инструментов
Полная сводка возможностей
Входные данные: 200 000
Вывод: 100 000
31 мая 2024 г.
o3-mini (2025-01-31) - Расширенные способности рассудка.
— структурированные выходные данные
обработка только текста
— Функции и инструменты
Входные данные: 200 000
Вывод: 100 000
Октябрь 2023 г.
o1 (2024-12-17) - Расширенные способности рассудка.
— структурированные выходные данные
— Текст, обработка изображений
— Функции и инструменты
Входные данные: 200 000
Вывод: 100 000
Октябрь 2023 г.
o1-preview (2024-09-12) Более ранняя предварительная версия Входные данные: 128 000
Выход: 32 768
Октябрь 2023 г.
o1-mini (2024-09-12) Более быстрый и более экономичный вариант в серии o1 идеально подходит для задач программирования, требующих скорости и снижения потребления ресурсов.

Глобальное стандартное развертывание, доступное по умолчанию.

Стандартные (региональные) развертывания в настоящее время доступны только для избранных клиентов, которые получили доступ в рамках ограниченного выпуска доступа o1-preview.
Входные данные: 128 000
Выходные данные: 65,536
Октябрь 2023 г.

Доступность

Чтобы узнать больше о расширенных o-series моделях, см. статью Начало работы с моделями рассуждения.

Доступность по регионам

Модель Область/регион
o4-mini Восточная часть США2 (глобальный стандарт)
Центральная Швеция (глобальный стандарт)
o3 Восточная часть США2 (глобальный стандарт)
Центральная Швеция (глобальный стандарт)
o3-mini См. таблицу моделей.
o1 См. таблицу моделей.
o1-preview См. таблицу моделей. Эта модель доступна только для клиентов, которым предоставлен доступ в рамках исходного ограниченного доступа.
o1-mini См. таблицу моделей.

GPT-4o и GPT-4 Turbo

GPT-4o интегрирует текст и изображения в одну модель, что позволяет одновременно обрабатывать несколько типов данных. Этот многомодальный подход повышает точность и скорость реагирования на взаимодействие с компьютером. GPT-4o соответствует GPT-4 Turbo в английском тексте и задачах программирования, обеспечивая более высокую производительность на языках, отличных от английского языка и задач визуального зрения, устанавливая новые тесты для возможностей искусственного интеллекта.

Как я могу получить доступ к моделям GPT-4o и GPT-4o mini?

GPT-4o и GPT-4o mini доступны для стандартного развертывания модели и глобального развертывания модели.

Необходимо создать или использовать существующий ресурс в поддерживаемом стандартном или глобальном стандартном регионе, где доступна модель.

Когда ваш ресурс создан, вы можете развернуть модели GPT-4o. Если вы выполняете автоматическое программное развертывание, то имена моделей следующие:

  • gpt-4o Версия2024-11-20
  • gpt-4o Версия2024-08-06
  • gpt-4o Версия2024-05-13
  • gpt-4o-mini Версия2024-07-18

GPT-4 Turbo

GPT-4 Turbo — это большая многомодальная модель (прием ввода текста или изображения и создание текста), которая может решить сложные проблемы с большей точностью, чем любая из предыдущих моделей OpenAI. Как и GPT-3.5 Turbo, и более старые модели GPT-4 GPT-4 Turbo оптимизированы для чата и хорошо работают для традиционных задач завершения.

Последний выпуск в общем доступе GPT-4 Turbo:

  • gpt-4 Версия:turbo-2024-04-09

Это замена для следующих моделей предварительной версии:

  • gpt-4 Версия:1106-Preview
  • gpt-4 Версия:0125-Preview
  • gpt-4 Версия:vision-preview

Различия между моделями OpenAI и Azure OpenAI GPT-4 Turbo GA

  • Версия OpenAI последней модели turbo 0409 поддерживает режим JSON и функцию вызова для всех запросов вывода.
  • Версия Azure OpenAI последней turbo-2024-04-09 в настоящее время не поддерживает использование режима JSON и вызова функций при выполнении запросов предсказания с входными данными изображения. Текстовые входные запросы (запросы без image_url и без встроенных изображений) поддерживают режим JSON и вызовы функций.

Различия от gpt-4 vision-preview

  • Интеграция специфических улучшений Vision для Azure AI с GPT-4 Turbo с Vision не поддерживается для gpt-4версии:turbo-2024-04-09. К ним относятся оптическое распознавание символов (OCR), заземление объектов, запросы видео и улучшенная обработка данных с помощью изображений.

Внимание

Предварительные функции улучшения визуального распознавания, включая оптическое распознавание символов (OCR), заземление объектов, видеоподсказки, будут прекращены и больше не будут доступны после обновления gpt-4 версии: vision-preview до turbo-2024-04-09. Если вы в настоящее время полагаетесь на какие-либо из этих предварительных функций, это автоматическое обновление модели станет значительным изменением.

Предоставленная управляемая доступность GPT-4 Turbo

  • gpt-4 Версия:turbo-2024-04-09 доступен как для стандартных, так и подготовленных развертываний. В настоящее время подготовленная версия этой модели не поддерживает запросы на вывод изображений и визуального зрения. Подготовленные развертывания этой модели принимают только текстовые входные данные. Развертывания стандартной модели принимают как текстовые, так и запросы вывода изображений и визуального распознавания.

Развертывание GPT-4 Turbo с выпуском Vision GA

Чтобы развернуть модель GA на портале Azure AI Foundry, выберите GPT-4, а затем найдите нужную turbo-2024-04-09 версию в раскрывающемся меню. Квота по умолчанию для gpt-4-turbo-2024-04-09 модели будет совпадать с текущей квотой для GPT-4-Turbo. См. ограничения региональной квоты.

GPT-4

GPT-4 является предшественником GPT-4 Turbo. Обе модели GPT-4 и GPT-4 Turbo имеют базовое имя gpt-4. Вы можете различать модели GPT-4 и Turbo, изучая версию модели.

  • gpt-4 Версия0314
  • gpt-4 Версия0613
  • gpt-4-32k Версия0613

Вы можете увидеть длину контекста маркера, поддерживаемую каждой моделью, в сводной таблице моделей.

Модели GPT-4 и GPT-4 Turbo

  • Эти модели можно использовать только с API завершения чата.

Ознакомьтесь с версиями моделей, чтобы узнать, как Служба Azure OpenAI обрабатывает обновления версий модели и работает с моделями , чтобы узнать, как просматривать и настраивать параметры версии модели развертываний GPT-4.

Идентификатор модели Описание Максимальное количество запросов (токены) Учебные данные (вплоть до)
gpt-4o (2024-11-20)
GPT-4o (Omni)
Последняя большая модель GA
— структурированные выходные данные
— Текст, обработка изображений
— режим JSON
— параллельные вызовы функций
— улучшенная точность и скорость реагирования
— Сопоставимость с английским текстом и задачами кодирования по сравнению с GPT-4 Turbo с зрением.
— высокая производительность на языках, отличных от английского языка, и в задачах визуального зрения.
- Улучшенная возможность творческого письма
Входные данные: 128 000
Выходные данные: 16 384
Октябрь 2023 г.
gpt-4o (2024-08-06)
GPT-4o (Omni)
— структурированные выходные данные
— Текст, обработка изображений
— режим JSON
— параллельные вызовы функций
— улучшенная точность и скорость реагирования
— Сопоставимость с английским текстом и задачами кодирования по сравнению с GPT-4 Turbo с зрением.
— высокая производительность на языках, отличных от английского языка, и в задачах визуального зрения
Входные данные: 128 000
Выходные данные: 16 384
Октябрь 2023 г.
gpt-4o-mini (2024-07-18)
GPT-4o mini
Последняя модель небольшой версии общего доступа
— Быстрая, недорогая, способная модель, идеально подходящая для замены моделей серии GPT-3.5 Turbo.
— Текст, обработка изображений
— режим JSON
— параллельные вызовы функций
Вход: 128 000
Выходные данные: 16 384
Октябрь 2023 г.
gpt-4o (2024-05-13)
GPT-4o (Omni)
Текст, обработка изображений
— режим JSON
— параллельные вызовы функций
— улучшенная точность и скорость реагирования
— Сопоставимость с английским текстом и задачами кодирования по сравнению с GPT-4 Turbo с зрением.
— высокая производительность на языках, отличных от английского языка, и в задачах визуального зрения
Входные данные: 128 000
Выходные данные: 4 096
Октябрь 2023 г.
gpt-4 (turbo-2024-04-09)
GPT-4 Turbo с видением
Новая модель общего доступа
— Замена всех предыдущих моделей GPT-4 (vision-preview, 1106-Preview, 0125-Preview).
- Доступность компонентов в настоящее время отличается в зависимости от метода ввода и типа развертывания.
Входные данные: 128 000
Выходные данные: 4 096
Декабрь 2023 г.
gpt-4 (0125-Preview)*
GPT-4 Turbo Preview
Предварительная версия модели
-Заменяет 1106-Preview
— повышение производительности создания кода
— уменьшает случаи, когда модель не завершает задачу
— режим JSON
— параллельные вызовы функций
— воспроизводимый результат (предпросмотр)
Входные данные: 128 000
Выходные данные: 4 096
Декабрь 2023 г.
gpt-4 (предварительный просмотр визуализации)
GPT-4 Turbo с предварительным просмотром функций компьютерного зрения
Предварительная версия модели
— принимает входные данные текста и изображения.
— поддерживает улучшения
— режим JSON
— параллельные вызовы функций
— воспроизводимый результат (предпросмотр)
Входные данные: 128 000
Выходные данные: 4 096
Апрель 2023 г.
gpt-4 (1106-предпросмотр)
GPT-4 Turbo Preview
Предварительная версия модели
— режим JSON
— параллельные вызовы функций
— воспроизводимый результат (предпросмотр)
Вход: 128 000
Выходные данные: 4 096
Апрель 2023 г.
gpt-4-32k (0613) Более старая модель GA
— Базовый вызов функций с инструментами
32,768 Сентябрь 2021 г.
gpt-4 (0613) Более старая модель GA
— Базовый вызов функций с инструментами
8,192 Сентябрь 2021 г.
gpt-4-32k(0314) Более старая модель GA
- Сведения о прекращении поддержки
32,768 Сентябрь 2021 г.
gpt-4 (0314) Более старая модель GA
- Сведения о прекращении поддержки
8,192 Сентябрь 2021 г.

Внимание

Мы не рекомендуем использовать предварительные версии моделей в рабочей среде. Мы обновим все предварительные модели до будущих версий или до последней стабильной версии. Модели, назначенные предварительной версией, не соответствуют стандартному жизненному циклу модели Azure OpenAI.

  • GPT-4 версии 0125-preview — это обновленная версия предварительной версии GPT-4 Turbo, выпущенная ранее в качестве версии 1106-preview.
  • GPT-4 версии 0125-preview выполняет задачи, такие как генерация кода, более полностью по сравнению с GPT-4-1106-preview. Из-за этого в зависимости от задачи клиенты могут обнаружить, что GPT-4-0125-preview создает больше выходных данных по сравнению с gpt-4-1106-preview. Мы рекомендуем клиентам сравнивать выходные данные новой модели. GPT-4-0125-preview также устраняет ошибки в gpt-4-1106-preview с обработкой UTF-8 для языков, отличных от английского языка.
  • GPT-4 — это последняя версия GA turbo-2024-04-09 и заменяет 0125-Preview, 1106-preview и также vision-preview.

GPT-3.5

Модели GPT-3.5 могут понять и создать естественный язык или код. Наиболее производительной и экономичной моделью в семействе GPT-3.5 является GPT-3.5 Turbo, которая оптимизирована для чата и хорошо справляется с традиционными задачами по завершению. GPT-3.5 Turbo доступен для использования с API завершения чата. GPT-3.5 Turbo Instruct имеет аналогичные возможности, как и text-davinci-003, но с использованием API завершений вместо API завершений чата. Мы рекомендуем использовать GPT-3.5 Turbo и GPT-3.5 Turbo Instruct над устаревшими моделями GPT-3.5 и GPT-3.

Идентификатор модели Описание Максимальное количество запросов (токены) Учебные данные (вплоть до)
gpt-35-turbo (0125) NEW Последняя модель GA
— режим JSON
— параллельные вызовы функций
— воспроизводимый вывод (предпросмотр)
— более высокая точность при реагировании в запрошенных форматах.
— Исправлена ошибка, из-за которой возникла проблема с кодировкой текста для вызовов функций, отличных от английского языка.
Входные данные: 16 385
Выходные данные: 4 096
Сентябрь 2021 г.
gpt-35-turbo (1106) Старая GA модель
— режим JSON
— параллельные вызовы функций
— воспроизводимый результат (предпросмотр)
Входные данные: 16 385
Выходные данные: 4 096
Сентябрь 2021 г.
gpt-35-turbo-instruct (0914) Только конечная точка завершения
— замена устаревших моделей завершения
4,097 Сентябрь 2021 г.
gpt-35-turbo-16k (0613) Старая GA модель
— Базовый вызов функций с инструментами
16,384 Сентябрь 2021 г.
gpt-35-turbo (0613) Старая GA модель
— Базовый вызов функций с инструментами
4096 Сентябрь 2021 г.
gpt-35-turbo 1 (0301) Старая GA модель
- Сведения о прекращении поддержки
4096 Сентябрь 2021 г.

Дополнительные сведения о взаимодействии с GPT-3.5 Turbo и API завершения чата вы можете узнать в нашем подробном руководстве.

1 Эта модель будет принимать запросы > 4096 токенов. Не рекомендуется превышать ограничение на 4096 входных маркеров, так как более новая версия модели ограничена 4096 токенами. Если возникают проблемы при превышении 4096 входных маркеров с этой моделью, эта конфигурация официально не поддерживается.

Встраивания

text-embedding-3-large является последней и самой способной моделью внедрения. Обновление между моделями встраивания невозможно. Для перехода от использования text-embedding-ada-002 к text-embedding-3-large, вам потребуется создать новые объекты векторизации.

  • text-embedding-3-large
  • text-embedding-3-small
  • text-embedding-ada-002

При тестировании OpenAI сообщает, что как большие, так и небольшие модели внедрения третьего поколения обеспечивают более высокую среднюю производительность при многоязычном извлечении согласно тесту MIRACL, при этом сохраняя уровень производительности для английских задач согласно тесту MTEB.

Эталон оценки text-embedding-ada-002 text-embedding-3-small text-embedding-3-large
Среднее значение MIRACL 31,4 44.0 54.9
Среднее значение MTEB 61,0 62,3 64.6

Модели внедрения третьего поколения поддерживают уменьшение размера внедрения с помощью нового dimensions параметра. Как правило, более крупные внедрения являются более дорогими с точки зрения вычислений, памяти и хранилища. Возможность настроить количество измерений позволяет более контролировать общую стоимость и производительность. Параметр dimensions не поддерживается во всех версиях библиотеки Python OpenAI 1.x, чтобы воспользоваться этим параметром, рекомендуется обновить до последней версии: pip install openai --upgrade

Тестирование по бенчмарку MTEB в OpenAI показало, что даже если размеры модели третьего поколения сокращаются до менее text-embeddings-ada-002 1536, производительность остается немного лучше.

DALL-E

Модели DALL-E создают изображения из текстовых запросов, которые предоставляет пользователь. DALL-E 3 обычно доступен для использования с интерфейсами REST API. DALL-E 2 и DALL-E 3 с клиентскими SDK доступны в предварительном просмотре.

Звуковые модели

Звуковые модели в Azure OpenAI доступны через API realtime, completions и интерфейсы audio API.

Aудиомодели GPT-4o

Звуковые модели GPT 4o являются частью семейства моделей GPT-4o и поддерживают либо низкую задержку в диалоговых взаимодействиях "речь на вход, речь на выход", либо генерацию звука.

Внимание

Мы не рекомендуем использовать предварительные версии моделей в рабочей среде. Мы обновим все предварительные модели до будущих версий или до последней стабильной версии. Модели, назначенные предварительной версией, не соответствуют стандартному жизненному циклу модели Azure OpenAI.

Сведения о максимальных токенах запроса и обучающих данных доступны в следующей таблице.

Идентификатор модели Описание Максимальное количество запросов (токены) Учебные данные (вплоть до)
gpt-4o-mini-audio-preview (2024-12-17)
GPT-4o Audio
Звуковая модель для создания звука и текста. Входные данные: 128 000
Выходные данные: 4 096
Октябрь 2023 г.
gpt-4o-mini-realtime-preview (2024-12-17)
GPT-4o Audio
Звуковая модель для обработки звука в режиме реального времени. Входные данные: 128 000
Выходные данные: 4 096
Октябрь 2023 г.
gpt-4o-audio-preview (2024-12-17)
GPT-4o Audio
Звуковая модель для создания звука и текста. Входные данные: 128 000
Выходные данные: 4 096
Октябрь 2023 г.
gpt-4o-realtime-preview (2024-12-17)
GPT-4o Audio
Звуковая модель для обработки звука в режиме реального времени. Ввод: 128 000
Выходные данные: 4 096
Октябрь 2023 г.
gpt-4o-realtime-preview (2024-10-01)
GPT-4o Audio
Звуковая модель для обработки звука в режиме реального времени. Входные данные: 128 000
Выходные данные: 4 096
Октябрь 2023 г.

Чтобы сравнить доступность звуковых моделей GPT-4o во всех регионах, см. таблицу моделей.

API для работы с аудио

Звуковые модели с помощью /audio API можно использовать для преобразования речи в текст, перевод и текст в речь.

Модели преобразования речи в текст

Идентификатор модели Описание Максимальный запрос (размер аудиофайла)
whisper Модель распознавания речи общего назначения. 25 Мб
gpt-4o-transcribe Преобразование речи в текст с поддержкой GPT-4o. 25 Мб
gpt-4o-mini-transcribe Преобразование речи в текст, работает на основе GPT-4o mini. 25 Мб

Модели перевода речи

Идентификатор модели Описание Максимальный запрос (размер аудиофайла)
whisper Модель распознавания речи общего назначения. 25 Мб

Модели преобразования текста в речь (предварительная версия)

Идентификатор модели Описание
tts Синтез речи, оптимизированный для скорости.
tts-hd Синтез речи, оптимизированный для высокого качества.
gpt-4o-mini-tts Модель преобразования текста в речь с помощью GPT-4o mini.

Вы можете управлять голосом, чтобы говорить в стиле или тоне.

Для получения дополнительной информации см. раздел Доступность аудиомоделей по регионам в этой статье.

Сводка модели и доступность в регионе

Модели по типу развертывания

Azure OpenAI предоставляет клиентам выбор в структуре размещения, которая соответствует своим бизнес-шаблонам и шаблонам использования. Служба предлагает два основных типа развертывания:

  • Стандарт предлагается с глобальным вариантом развертывания, маршрутизация трафика глобально для обеспечения более высокой пропускной способности.
  • Выделенный также предоставляется с глобальным вариантом развертывания, что даёт клиентам возможность приобретать и развертывать выделенные единицы пропускной способности в глобальной инфраструктуре Azure.

Все развертывания могут выполнять те же операции вывода, однако выставление счетов, масштабирование и производительность существенно отличаются. Дополнительные сведения о типах развертывания Azure OpenAI см. в руководстве по типам развертывания.

Доступность глобальной стандартной модели

Регион o4-mini, 2025-04-16 gpt-4.1, 2025-04-14 gpt-4.1-nano, 2025-04-14 gpt-4.1-mini, 2025-04-14 gpt-4.5-preview, 2025-02-27 o3-mini, 2025-01-31 o1, 2024-12-17 o1-preview, 2024-09-12 o1-mini, 2024-09-12 gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o, 2024-11-20 gpt-4o-mini, 2024-07-18 gpt-4, turbo-2024-04-09 text-embedding-3-small, 1 text-embedding-3-large, 1 text-embedding-ada-002, 2 gpt-4o-realtime-preview, 2024-12-17 gpt-4o-audio-preview, 2024-12-17 gpt-4o-mini-realtime-preview, 2024-12-17 gpt-4o-mini-audio-preview, 2024-12-17 gpt-4o-transcribe, 2025-03-20 gpt-4o-mini-tts, 2025-03-20 gpt-4o-mini-transcribe, 2025-03-20
Австралия Восток - - - - - - - - - - - - - - -
бразильский юг - - - - - - - - - - - - - -
Восточная Канада - - - - - - - - - - - - - -
eastus - - - - - - - - - - -
eastus2
francecentral - - - - - - - - - - - - - -
Германия-запад-центр - - - - - - - - - - - - - -
северная италия - - - - - - - - - - - - - - - - -
japaneast - - - - - - - - - - - - - -
koreacentral - - - - - - - - - - - - - -
northcentralus - - - - - - - - - - - -
Норвегия-восток - - - - - - - - - - - - - -
Центральная Польша - - - - - - - - - - - - - -
southafricanorth - - - - - - - - - - - - - -
southcentralus - - - - - - - - - - - -
Южная Индия - - - - - - - - - - - - - -
spaincentral - - - - - - - - - - - - - -
SwedenCentral -
север Швейцарии - - - - - - - - - - - - - -
uaenorth - - - - - - - - - - - - - -
uksouth - - - - - - - - - - - - - -
westeurope - - - - - - - - - - - - - -
westus - - - - - - - - - - - -
westus3 - - - - - - - - - - - -

Примечание.

o1-mini в настоящее время доступен всем клиентам для глобального стандартного развертывания.

Выбранным клиентам был предоставлен стандартный (региональный) доступ к развертыванию o1-mini в рамках ограниченного выпуска o1-preview. В настоящее время доступ к стандартным o1-mini (региональным) развертываниям не расширяется.

Эта таблица не содержит сведения о точной настройке региональной доступности. Ознакомьтесь с разделом по тонкой настройке для получения этой информации.

Стандартные модели развертывания (региональные) по конечной точке

Завершение чата

Регион o1-preview, 2024-09-12 o1-mini, 2024-09-12 gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o, 2024-11-20 gpt-4o-mini, 2024-07-18 gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, vision-preview gpt-4, turbo-2024-04-09 gpt-4-32k, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613
Австралия Восток - - - - - - - -
Восточная Канада - - - - - - - - -
eastus - - - - -
eastus2 - - - - -
francecentral - - - - - - - - -
japaneast - - - - - - - - - - -
northcentralus - - - - -
Норвегия-восток - - - - - - - - - - - - - -
southcentralus - - - - - - -
Южная Индия - - - - - - - - - - - -
SwedenCentral -
север Швейцарии - - - - - - - - - -
uksouth - - - - - - - - - -
westeurope - - - - - - - - - - - - - -
westus - - - - -
westus3 - - - - - - -

Примечание.

o1-mini в настоящее время доступен всем клиентам для глобального стандартного развертывания.

Выбранным клиентам был предоставлен стандартный (региональный) доступ к развертыванию o1-mini в рамках ограниченного выпуска o1-preview. В настоящее время доступ к стандартным o1-mini (региональным) развертываниям не расширяется.

Доступность модели GPT-4 и GPT-4 Turbo

Выбор уровня доступа для клиента

Помимо указанных выше регионов, доступных всем клиентам Azure OpenAI, некоторые из них получили доступ к версиям GPT-4 в дополнительных регионах:

Модель Область/регион
gpt-4 (0314)
gpt-4-32k (0314)
Восточная часть США
Центральная Франция
Южная часть США
южная часть Соединенного Королевства
gpt-4 (0613)
gpt-4-32k (0613)
Восточная часть США
Восточная часть США 2
Восточная Япония
южная часть Соединенного Королевства

Модели GPT-3.5

Ознакомьтесь с версиями моделей, чтобы узнать, как Служба Azure OpenAI обрабатывает обновления версий модели и работает с моделями , чтобы узнать, как просматривать и настраивать параметры версии модели для развертываний GPT-3.5 Turbo.

Тонкая настройка моделей

Примечание.

gpt-35-turbo — Настройка этой модели ограничена подмножеством регионов и недоступна в каждом регионе, где доступна базовая модель.

Поддерживаемые регионы для точной настройки могут отличаться, если вы используете модели Azure OpenAI в проекте Azure AI Foundry и вне проекта.

Идентификатор модели Точная настройка регионов Максимальный запрос (токены) Учебные данные (вплоть до)
gpt-35-turbo (1106) Восточная часть США2
Северная часть США
Центральная Швеция
Западная Швейцария
Входные данные: 16 385
Выходные данные: 4 096
Сентябрь 2021 г.
gpt-35-turbo (0125) Восточная часть США2
Северная часть США
Центральная Швеция
Западная Швейцария
16,385 Сентябрь 2021 г.
gpt-4o-mini (2024-07-18) Северная часть США
Центральная Швеция
Входные данные: 128 000
Результат: 16 384
Длина контекста примера обучения: 64 536
Октябрь 2023 г.
gpt-4o (2024-08-06) Восточная часть США2
Северная часть США
Центральная Швеция
Входные данные: 128 000
Выходные данные: 16 384
Длина контекста примера обучения: 64 536
Октябрь 2023 г.

Помощники (предварительная версия)

Для Помощников требуется сочетание поддерживаемой модели и поддерживаемого региона. Для некоторых инструментов и возможностей требуются последние модели. Следующие модели доступны в API Помощников, пакете SDK и Azure AI Foundry. Следующая таблица предназначена для оплаты по мере использования. Сведения о доступности единицы выделенной пропускной способности (PTU) см. в статье о выделенной пропускной способности. Перечисленные модели и регионы можно использовать как с помощниками версии 1, так и с версией 2. Вы можете использовать глобальные стандартные модели , если они поддерживаются в перечисленных ниже регионах.

Регион gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, turbo-2024-04-09 gpt-4-32k, 0613 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613
Австралия Восток - - - - -
eastus - - - -
eastus2 - - - -
francecentral - - - - - -
japaneast - - - - - - - - -
Норвегия-восток - - - - - - - - - - -
Южная Индия - - - - - - - - -
SwedenCentral - -
uksouth - - - - - -
westus - - - - -
westus3 - - - - - -

Вывод модели из эксплуатации

Последние сведения о выводе моделей из эксплуатации см. в руководстве по выводу моделей из эксплуатации.

Следующие шаги