Примечание
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Служба Azure OpenAI работает на платформе разнообразного набора моделей с разными возможностями и ценовыми категориями. Доступность модели зависит от региона и облака. Сведения о доступности модели для Azure для государственных организаций см. в службе OpenAI для Azure для государственных организаций.
Модели | Описание |
---|---|
Серия GPT-4.1 | Последняя версия модели из Azure OpenAI |
предварительный просмотр использования компьютера | Экспериментальная модель, обученная для использования с инструментом API Responses для работы с компьютером. |
Предварительная версия GPT-4.5 | Последняя модель GPT, которая превосходно справляется с разнообразными задачами по работе с текстом и изображениями. |
модели o-серии | Модели рассуждения с расширенной способностью решать задачи и повышенным вниманием и способностями. |
GPT-4o & GPT-4o mini & GPT-4 Turbo | Последние модели Azure OpenAI с многомодальными версиями, которые могут принимать как текст, так и изображения в качестве входных данных. |
GPT-4 | Набор моделей, которые улучшают GPT-3.5 и могут понимать и создавать естественный язык и код. |
GPT-3.5 | Набор моделей, которые улучшают GPT-3 и могут понимать и создавать естественный язык и код. |
Внедрение | Набор моделей, способных преобразовывать текст в числовую векторную форму для обеспечения сходства текстов. |
DALL-E | Серия моделей, которые могут создавать исходные изображения на естественном языке. |
Звук: | Серия моделей для преобразования речи в текст, перевод и текст в речь. Звуковые модели GPT-4o поддерживают либо с низкой задержкой, "ввод речи, вывод речи" разговорные взаимодействия, либо генерацию аудио. |
Серия GPT 4.1
Доступность по регионам
Модель | Область/регион |
---|---|
gpt-4.1 (2025-04-14) |
Восточная часть США2 (глобальный стандарт), Центральная Швеция (глобальный стандарт) |
gpt-4.1-nano (2025-04-14) |
Восточная часть США2 (глобальный стандарт), Центральная Швеция (глобальный стандарт) |
gpt-4.1-mini (2025-04-14) |
Восточная часть США2 (глобальный стандарт), Центральная Швеция (глобальный стандарт) |
Возможности
Идентификатор модели | Описание | Окно контекста | Максимальное количество выходных токенов | Учебные данные (вплоть до) |
---|---|---|---|---|
gpt-4.1 (2025-04-14) |
— ввод текста и изображения — вывод текста — API завершения чата — API ответов - Потоковое воспроизведение — Вызов функции Структурированные выходные данные (завершение чата) |
1,047,576 | 32,768 | 31 мая 2024 г. |
gpt-4.1-nano (2025-04-14) Быстрая модель 4.1 |
— ввод текста и изображения — вывод текста — API завершения чата — API ответов - Потоковое воспроизведение — Вызов функции Структурированные выходные данные (завершение чата) |
1,047,576 | 32,768 | 31 мая 2024 г. |
gpt-4.1-mini (2025-04-14) |
— ввод текста и изображения — вывод текста — API завершения чата — API ответов - Потоковое воспроизведение — Вызов функции Структурированные выходные данные (завершение чата) |
1,047,576 | 32,768 | 31 мая 2024 г. |
предварительный просмотр использования компьютера
Экспериментальная модель, обученная для использования с инструментом API ответов. Его можно использовать в сочетании с 3-сторонними библиотеками, чтобы позволить модели управлять вводом мыши и клавиатуры при получении контекста из снимков экрана текущей среды.
Внимание
Мы не рекомендуем использовать предварительные версии моделей в рабочей среде. Мы обновим все предварительные модели до будущих версий или до последней стабильной версии. Модели, назначенные предварительной версией, не соответствуют стандартному жизненному циклу модели Azure OpenAI.
Доступность
Для доступа к computer-use-preview
требуется регистрация, и доступ будет предоставлен на основе критериев приемлемости корпорации Майкрософт. Клиентам, имеющим доступ к другим моделям ограниченного доступа, по-прежнему потребуется запросить доступ к этой модели.
Запрос доступа: computer-use-preview
приложение модели ограниченного доступа
После предоставления доступа необходимо создать деплоймент для модели.
Доступность по регионам
Модель | Область/регион |
---|---|
computer-use-preview |
Восток США 2 (Глобальный стандарт) Южная Индия (глобальный стандарт) Центральная Швеция (глобальный стандарт) |
Возможности
Идентификатор модели | Описание | Окно контекста | Максимальное количество выходных токенов | Учебные данные (вплоть до) |
---|---|---|---|---|
computer-use-preview (2025-03-11) |
Специализированная модель для использования с инструментом API ответов -Инструменты -Стриминг -Text(input/output) — Изображение(ввод) |
8,192 | 1,024 | Октябрь 2023 г. |
Предварительная версия GPT-4.5
Доступность по регионам
Модель | Область/регион |
---|---|
gpt-4.5-preview |
Восток США 2 (Глобальный стандарт) Центральная Швеция (глобальный стандарт) |
Возможности
Идентификатор модели | Описание | Окно контекста | Максимальное количество выходных токенов | Учебные данные (вплоть до) |
---|---|---|---|---|
gpt-4.5-preview (2025-02-27) Предварительная версия GPT-4.5 |
GPT 4.1 является рекомендуемой заменой для этой модели. Отличается высокой эффективностью в работе с различными текстовыми и графическими задачами. -Структурированные выходные данные -Кэширование запросов -Инструменты -Стриминг -Text(input/output) — Изображение(ввод) |
128 000 | 16,384 | Октябрь 2023 г. |
Примечание.
Ожидается, что модель не может ответить на вопросы о себе. Если вы хотите узнать, когда были установлены ограничения на данные обучения модели, или получить другие сведения о модели, обратитесь к документации модели выше.
модели o-серии
Модели серии Azure OpenAI* специально разработаны для решения задач логического мышления и поиска решений с улучшенными возможностями и повышенной сосредоточенностью. Эти модели тратят больше времени на обработку и понимание запроса пользователя, что делает их исключительно сильными в таких областях, как наука, программирование и математика по сравнению с предыдущими итерациями.
Идентификатор модели | Описание | Максимальное количество запросов (токены) | Учебные данные (вплоть до) |
---|---|---|---|
o4-mini (2025-04-16) |
-
НОВАЯ модель рассуждений, предлагающая расширенные возможности аргументирования. — API завершения чата - API ответов — структурированные выходные данные — Текст, обработка изображений — Функции/инструменты и вызов параллельных инструментов Полная сводка возможностей |
Входные данные: 200 000 Вывод: 100 000 |
31 мая 2024 г. |
o3 (2025-04-16) |
-
НОВАЯ модель рассуждений, предлагающая расширенные возможности аргументирования. — API завершения чата - API ответов — структурированные выходные данные — Текст, обработка изображений — Функции/инструменты и вызов параллельных инструментов Полная сводка возможностей |
Входные данные: 200 000 Вывод: 100 000 |
31 мая 2024 г. |
o3-mini (2025-01-31) |
-
Расширенные способности рассудка. — структурированные выходные данные обработка только текста — Функции и инструменты |
Входные данные: 200 000 Вывод: 100 000 |
Октябрь 2023 г. |
o1 (2024-12-17) |
-
Расширенные способности рассудка. — структурированные выходные данные — Текст, обработка изображений — Функции и инструменты |
Входные данные: 200 000 Вывод: 100 000 |
Октябрь 2023 г. |
o1-preview (2024-09-12) |
Более ранняя предварительная версия | Входные данные: 128 000 Выход: 32 768 |
Октябрь 2023 г. |
o1-mini (2024-09-12) |
Более быстрый и более экономичный вариант в серии o1 идеально подходит для задач программирования, требующих скорости и снижения потребления ресурсов. Глобальное стандартное развертывание, доступное по умолчанию. Стандартные (региональные) развертывания в настоящее время доступны только для избранных клиентов, которые получили доступ в рамках ограниченного выпуска доступа o1-preview . |
Входные данные: 128 000 Выходные данные: 65,536 |
Октябрь 2023 г. |
Доступность
Чтобы узнать больше о расширенных o-series
моделях, см. статью Начало работы с моделями рассуждения.
Доступность по регионам
Модель | Область/регион |
---|---|
o4-mini |
Восточная часть США2 (глобальный стандарт) Центральная Швеция (глобальный стандарт) |
o3 |
Восточная часть США2 (глобальный стандарт) Центральная Швеция (глобальный стандарт) |
o3-mini |
См. таблицу моделей. |
o1 |
См. таблицу моделей. |
o1-preview |
См. таблицу моделей. Эта модель доступна только для клиентов, которым предоставлен доступ в рамках исходного ограниченного доступа. |
o1-mini |
См. таблицу моделей. |
GPT-4o и GPT-4 Turbo
GPT-4o интегрирует текст и изображения в одну модель, что позволяет одновременно обрабатывать несколько типов данных. Этот многомодальный подход повышает точность и скорость реагирования на взаимодействие с компьютером. GPT-4o соответствует GPT-4 Turbo в английском тексте и задачах программирования, обеспечивая более высокую производительность на языках, отличных от английского языка и задач визуального зрения, устанавливая новые тесты для возможностей искусственного интеллекта.
Как я могу получить доступ к моделям GPT-4o и GPT-4o mini?
GPT-4o и GPT-4o mini доступны для стандартного развертывания модели и глобального развертывания модели.
Необходимо создать или использовать существующий ресурс в поддерживаемом стандартном или глобальном стандартном регионе, где доступна модель.
Когда ваш ресурс создан, вы можете развернуть модели GPT-4o. Если вы выполняете автоматическое программное развертывание, то имена моделей следующие:
-
gpt-4o
Версия2024-11-20
-
gpt-4o
Версия2024-08-06
-
gpt-4o
Версия2024-05-13
-
gpt-4o-mini
Версия2024-07-18
GPT-4 Turbo
GPT-4 Turbo — это большая многомодальная модель (прием ввода текста или изображения и создание текста), которая может решить сложные проблемы с большей точностью, чем любая из предыдущих моделей OpenAI. Как и GPT-3.5 Turbo, и более старые модели GPT-4 GPT-4 Turbo оптимизированы для чата и хорошо работают для традиционных задач завершения.
Последний выпуск в общем доступе GPT-4 Turbo:
-
gpt-4
Версия:turbo-2024-04-09
Это замена для следующих моделей предварительной версии:
-
gpt-4
Версия:1106-Preview
-
gpt-4
Версия:0125-Preview
-
gpt-4
Версия:vision-preview
Различия между моделями OpenAI и Azure OpenAI GPT-4 Turbo GA
- Версия OpenAI последней модели turbo
0409
поддерживает режим JSON и функцию вызова для всех запросов вывода. - Версия Azure OpenAI последней
turbo-2024-04-09
в настоящее время не поддерживает использование режима JSON и вызова функций при выполнении запросов предсказания с входными данными изображения. Текстовые входные запросы (запросы безimage_url
и без встроенных изображений) поддерживают режим JSON и вызовы функций.
Различия от gpt-4 vision-preview
- Интеграция специфических улучшений Vision для Azure AI с GPT-4 Turbo с Vision не поддерживается для
gpt-4
версии:turbo-2024-04-09
. К ним относятся оптическое распознавание символов (OCR), заземление объектов, запросы видео и улучшенная обработка данных с помощью изображений.
Внимание
Предварительные функции улучшения визуального распознавания, включая оптическое распознавание символов (OCR), заземление объектов, видеоподсказки, будут прекращены и больше не будут доступны после обновления gpt-4
версии: vision-preview
до turbo-2024-04-09
. Если вы в настоящее время полагаетесь на какие-либо из этих предварительных функций, это автоматическое обновление модели станет значительным изменением.
Предоставленная управляемая доступность GPT-4 Turbo
-
gpt-4
Версия:turbo-2024-04-09
доступен как для стандартных, так и подготовленных развертываний. В настоящее время подготовленная версия этой модели не поддерживает запросы на вывод изображений и визуального зрения. Подготовленные развертывания этой модели принимают только текстовые входные данные. Развертывания стандартной модели принимают как текстовые, так и запросы вывода изображений и визуального распознавания.
Развертывание GPT-4 Turbo с выпуском Vision GA
Чтобы развернуть модель GA на портале Azure AI Foundry, выберите GPT-4
, а затем найдите нужную turbo-2024-04-09
версию в раскрывающемся меню. Квота по умолчанию для gpt-4-turbo-2024-04-09
модели будет совпадать с текущей квотой для GPT-4-Turbo. См. ограничения региональной квоты.
GPT-4
GPT-4 является предшественником GPT-4 Turbo. Обе модели GPT-4 и GPT-4 Turbo имеют базовое имя gpt-4
. Вы можете различать модели GPT-4 и Turbo, изучая версию модели.
-
gpt-4
Версия0314
-
gpt-4
Версия0613
-
gpt-4-32k
Версия0613
Вы можете увидеть длину контекста маркера, поддерживаемую каждой моделью, в сводной таблице моделей.
Модели GPT-4 и GPT-4 Turbo
- Эти модели можно использовать только с API завершения чата.
Ознакомьтесь с версиями моделей, чтобы узнать, как Служба Azure OpenAI обрабатывает обновления версий модели и работает с моделями , чтобы узнать, как просматривать и настраивать параметры версии модели развертываний GPT-4.
Идентификатор модели | Описание | Максимальное количество запросов (токены) | Учебные данные (вплоть до) |
---|---|---|---|
gpt-4o (2024-11-20) GPT-4o (Omni) |
Последняя большая модель GA — структурированные выходные данные — Текст, обработка изображений — режим JSON — параллельные вызовы функций — улучшенная точность и скорость реагирования — Сопоставимость с английским текстом и задачами кодирования по сравнению с GPT-4 Turbo с зрением. — высокая производительность на языках, отличных от английского языка, и в задачах визуального зрения. - Улучшенная возможность творческого письма |
Входные данные: 128 000 Выходные данные: 16 384 |
Октябрь 2023 г. |
gpt-4o (2024-08-06) GPT-4o (Omni) |
— структурированные выходные данные — Текст, обработка изображений — режим JSON — параллельные вызовы функций — улучшенная точность и скорость реагирования — Сопоставимость с английским текстом и задачами кодирования по сравнению с GPT-4 Turbo с зрением. — высокая производительность на языках, отличных от английского языка, и в задачах визуального зрения |
Входные данные: 128 000 Выходные данные: 16 384 |
Октябрь 2023 г. |
gpt-4o-mini (2024-07-18) GPT-4o mini |
Последняя модель небольшой версии общего доступа — Быстрая, недорогая, способная модель, идеально подходящая для замены моделей серии GPT-3.5 Turbo. — Текст, обработка изображений — режим JSON — параллельные вызовы функций |
Вход: 128 000 Выходные данные: 16 384 |
Октябрь 2023 г. |
gpt-4o (2024-05-13) GPT-4o (Omni) |
Текст, обработка изображений — режим JSON — параллельные вызовы функций — улучшенная точность и скорость реагирования — Сопоставимость с английским текстом и задачами кодирования по сравнению с GPT-4 Turbo с зрением. — высокая производительность на языках, отличных от английского языка, и в задачах визуального зрения |
Входные данные: 128 000 Выходные данные: 4 096 |
Октябрь 2023 г. |
gpt-4 (turbo-2024-04-09) GPT-4 Turbo с видением |
Новая модель общего доступа — Замена всех предыдущих моделей GPT-4 ( vision-preview , 1106-Preview , 0125-Preview ). - Доступность компонентов в настоящее время отличается в зависимости от метода ввода и типа развертывания. |
Входные данные: 128 000 Выходные данные: 4 096 |
Декабрь 2023 г. |
gpt-4 (0125-Preview)*GPT-4 Turbo Preview |
Предварительная версия модели -Заменяет 1106-Preview — повышение производительности создания кода — уменьшает случаи, когда модель не завершает задачу — режим JSON — параллельные вызовы функций — воспроизводимый результат (предпросмотр) |
Входные данные: 128 000 Выходные данные: 4 096 |
Декабрь 2023 г. |
gpt-4 (предварительный просмотр визуализации)GPT-4 Turbo с предварительным просмотром функций компьютерного зрения |
Предварительная версия модели — принимает входные данные текста и изображения. — поддерживает улучшения — режим JSON — параллельные вызовы функций — воспроизводимый результат (предпросмотр) |
Входные данные: 128 000 Выходные данные: 4 096 |
Апрель 2023 г. |
gpt-4 (1106-предпросмотр)GPT-4 Turbo Preview |
Предварительная версия модели — режим JSON — параллельные вызовы функций — воспроизводимый результат (предпросмотр) |
Вход: 128 000 Выходные данные: 4 096 |
Апрель 2023 г. |
gpt-4-32k (0613) |
Более старая модель GA — Базовый вызов функций с инструментами |
32,768 | Сентябрь 2021 г. |
gpt-4 (0613) |
Более старая модель GA — Базовый вызов функций с инструментами |
8,192 | Сентябрь 2021 г. |
gpt-4-32k (0314) |
Более старая модель GA - Сведения о прекращении поддержки |
32,768 | Сентябрь 2021 г. |
gpt-4 (0314) |
Более старая модель GA - Сведения о прекращении поддержки |
8,192 | Сентябрь 2021 г. |
Внимание
Мы не рекомендуем использовать предварительные версии моделей в рабочей среде. Мы обновим все предварительные модели до будущих версий или до последней стабильной версии. Модели, назначенные предварительной версией, не соответствуют стандартному жизненному циклу модели Azure OpenAI.
- GPT-4 версии 0125-preview — это обновленная версия предварительной версии GPT-4 Turbo, выпущенная ранее в качестве версии 1106-preview.
- GPT-4 версии 0125-preview выполняет задачи, такие как генерация кода, более полностью по сравнению с GPT-4-1106-preview. Из-за этого в зависимости от задачи клиенты могут обнаружить, что GPT-4-0125-preview создает больше выходных данных по сравнению с gpt-4-1106-preview. Мы рекомендуем клиентам сравнивать выходные данные новой модели. GPT-4-0125-preview также устраняет ошибки в gpt-4-1106-preview с обработкой UTF-8 для языков, отличных от английского языка.
- GPT-4 — это последняя версия GA
turbo-2024-04-09
и заменяет0125-Preview
,1106-preview
и такжеvision-preview
.
GPT-3.5
Модели GPT-3.5 могут понять и создать естественный язык или код. Наиболее производительной и экономичной моделью в семействе GPT-3.5 является GPT-3.5 Turbo, которая оптимизирована для чата и хорошо справляется с традиционными задачами по завершению. GPT-3.5 Turbo доступен для использования с API завершения чата. GPT-3.5 Turbo Instruct имеет аналогичные возможности, как и text-davinci-003
, но с использованием API завершений вместо API завершений чата. Мы рекомендуем использовать GPT-3.5 Turbo и GPT-3.5 Turbo Instruct над устаревшими моделями GPT-3.5 и GPT-3.
Идентификатор модели | Описание | Максимальное количество запросов (токены) | Учебные данные (вплоть до) |
---|---|---|---|
gpt-35-turbo (0125) NEW |
Последняя модель GA — режим JSON — параллельные вызовы функций — воспроизводимый вывод (предпросмотр) — более высокая точность при реагировании в запрошенных форматах. — Исправлена ошибка, из-за которой возникла проблема с кодировкой текста для вызовов функций, отличных от английского языка. |
Входные данные: 16 385 Выходные данные: 4 096 |
Сентябрь 2021 г. |
gpt-35-turbo (1106) |
Старая GA модель — режим JSON — параллельные вызовы функций — воспроизводимый результат (предпросмотр) |
Входные данные: 16 385 Выходные данные: 4 096 |
Сентябрь 2021 г. |
gpt-35-turbo-instruct (0914) |
Только конечная точка завершения — замена устаревших моделей завершения |
4,097 | Сентябрь 2021 г. |
gpt-35-turbo-16k (0613) |
Старая GA модель — Базовый вызов функций с инструментами |
16,384 | Сентябрь 2021 г. |
gpt-35-turbo (0613) |
Старая GA модель — Базовый вызов функций с инструментами |
4096 | Сентябрь 2021 г. |
gpt-35-turbo
1 (0301) |
Старая GA модель - Сведения о прекращении поддержки |
4096 | Сентябрь 2021 г. |
Дополнительные сведения о взаимодействии с GPT-3.5 Turbo и API завершения чата вы можете узнать в нашем подробном руководстве.
1 Эта модель будет принимать запросы > 4096 токенов. Не рекомендуется превышать ограничение на 4096 входных маркеров, так как более новая версия модели ограничена 4096 токенами. Если возникают проблемы при превышении 4096 входных маркеров с этой моделью, эта конфигурация официально не поддерживается.
Встраивания
text-embedding-3-large
является последней и самой способной моделью внедрения. Обновление между моделями встраивания невозможно. Для перехода от использования text-embedding-ada-002
к text-embedding-3-large
, вам потребуется создать новые объекты векторизации.
text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002
При тестировании OpenAI сообщает, что как большие, так и небольшие модели внедрения третьего поколения обеспечивают более высокую среднюю производительность при многоязычном извлечении согласно тесту MIRACL, при этом сохраняя уровень производительности для английских задач согласно тесту MTEB.
Эталон оценки | text-embedding-ada-002 |
text-embedding-3-small |
text-embedding-3-large |
---|---|---|---|
Среднее значение MIRACL | 31,4 | 44.0 | 54.9 |
Среднее значение MTEB | 61,0 | 62,3 | 64.6 |
Модели внедрения третьего поколения поддерживают уменьшение размера внедрения с помощью нового dimensions
параметра. Как правило, более крупные внедрения являются более дорогими с точки зрения вычислений, памяти и хранилища. Возможность настроить количество измерений позволяет более контролировать общую стоимость и производительность. Параметр dimensions
не поддерживается во всех версиях библиотеки Python OpenAI 1.x, чтобы воспользоваться этим параметром, рекомендуется обновить до последней версии: pip install openai --upgrade
Тестирование по бенчмарку MTEB в OpenAI показало, что даже если размеры модели третьего поколения сокращаются до менее text-embeddings-ada-002
1536, производительность остается немного лучше.
DALL-E
Модели DALL-E создают изображения из текстовых запросов, которые предоставляет пользователь. DALL-E 3 обычно доступен для использования с интерфейсами REST API. DALL-E 2 и DALL-E 3 с клиентскими SDK доступны в предварительном просмотре.
Звуковые модели
Звуковые модели в Azure OpenAI доступны через API realtime
, completions
и интерфейсы audio
API.
Aудиомодели GPT-4o
Звуковые модели GPT 4o являются частью семейства моделей GPT-4o и поддерживают либо низкую задержку в диалоговых взаимодействиях "речь на вход, речь на выход", либо генерацию звука.
Внимание
Мы не рекомендуем использовать предварительные версии моделей в рабочей среде. Мы обновим все предварительные модели до будущих версий или до последней стабильной версии. Модели, назначенные предварительной версией, не соответствуют стандартному жизненному циклу модели Azure OpenAI.
Сведения о максимальных токенах запроса и обучающих данных доступны в следующей таблице.
Идентификатор модели | Описание | Максимальное количество запросов (токены) | Учебные данные (вплоть до) |
---|---|---|---|
gpt-4o-mini-audio-preview (2024-12-17) GPT-4o Audio |
Звуковая модель для создания звука и текста. | Входные данные: 128 000 Выходные данные: 4 096 |
Октябрь 2023 г. |
gpt-4o-mini-realtime-preview (2024-12-17) GPT-4o Audio |
Звуковая модель для обработки звука в режиме реального времени. | Входные данные: 128 000 Выходные данные: 4 096 |
Октябрь 2023 г. |
gpt-4o-audio-preview (2024-12-17) GPT-4o Audio |
Звуковая модель для создания звука и текста. | Входные данные: 128 000 Выходные данные: 4 096 |
Октябрь 2023 г. |
gpt-4o-realtime-preview (2024-12-17) GPT-4o Audio |
Звуковая модель для обработки звука в режиме реального времени. | Ввод: 128 000 Выходные данные: 4 096 |
Октябрь 2023 г. |
gpt-4o-realtime-preview (2024-10-01) GPT-4o Audio |
Звуковая модель для обработки звука в режиме реального времени. | Входные данные: 128 000 Выходные данные: 4 096 |
Октябрь 2023 г. |
Чтобы сравнить доступность звуковых моделей GPT-4o во всех регионах, см. таблицу моделей.
API для работы с аудио
Звуковые модели с помощью /audio
API можно использовать для преобразования речи в текст, перевод и текст в речь.
Модели преобразования речи в текст
Идентификатор модели | Описание | Максимальный запрос (размер аудиофайла) |
---|---|---|
whisper |
Модель распознавания речи общего назначения. | 25 Мб |
gpt-4o-transcribe |
Преобразование речи в текст с поддержкой GPT-4o. | 25 Мб |
gpt-4o-mini-transcribe |
Преобразование речи в текст, работает на основе GPT-4o mini. | 25 Мб |
Модели перевода речи
Идентификатор модели | Описание | Максимальный запрос (размер аудиофайла) |
---|---|---|
whisper |
Модель распознавания речи общего назначения. | 25 Мб |
Модели преобразования текста в речь (предварительная версия)
Идентификатор модели | Описание |
---|---|
tts |
Синтез речи, оптимизированный для скорости. |
tts-hd |
Синтез речи, оптимизированный для высокого качества. |
gpt-4o-mini-tts |
Модель преобразования текста в речь с помощью GPT-4o mini. Вы можете управлять голосом, чтобы говорить в стиле или тоне. |
Для получения дополнительной информации см. раздел Доступность аудиомоделей по регионам в этой статье.
Сводка модели и доступность в регионе
Модели по типу развертывания
Azure OpenAI предоставляет клиентам выбор в структуре размещения, которая соответствует своим бизнес-шаблонам и шаблонам использования. Служба предлагает два основных типа развертывания:
- Стандарт предлагается с глобальным вариантом развертывания, маршрутизация трафика глобально для обеспечения более высокой пропускной способности.
- Выделенный также предоставляется с глобальным вариантом развертывания, что даёт клиентам возможность приобретать и развертывать выделенные единицы пропускной способности в глобальной инфраструктуре Azure.
Все развертывания могут выполнять те же операции вывода, однако выставление счетов, масштабирование и производительность существенно отличаются. Дополнительные сведения о типах развертывания Azure OpenAI см. в руководстве по типам развертывания.
- Глобальный стандарт
- Глобальный обеспеченный управляемый
- Глобальный пакет
- Стандарт зоны данных
- Настроенная зона данных
- Пакет зоны данных
- Стандартные
- Поставляется и управляема
Доступность глобальной стандартной модели
Регион | o4-mini, 2025-04-16 | gpt-4.1, 2025-04-14 | gpt-4.1-nano, 2025-04-14 | gpt-4.1-mini, 2025-04-14 | gpt-4.5-preview, 2025-02-27 | o3-mini, 2025-01-31 | o1, 2024-12-17 | o1-preview, 2024-09-12 | o1-mini, 2024-09-12 | gpt-4o, 2024-05-13 | gpt-4o, 2024-08-06 | gpt-4o, 2024-11-20 | gpt-4o-mini, 2024-07-18 | gpt-4, turbo-2024-04-09 | text-embedding-3-small, 1 | text-embedding-3-large, 1 | text-embedding-ada-002, 2 | gpt-4o-realtime-preview, 2024-12-17 | gpt-4o-audio-preview, 2024-12-17 | gpt-4o-mini-realtime-preview, 2024-12-17 | gpt-4o-mini-audio-preview, 2024-12-17 | gpt-4o-transcribe, 2025-03-20 | gpt-4o-mini-tts, 2025-03-20 | gpt-4o-mini-transcribe, 2025-03-20 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Австралия Восток | - | - | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
бразильский юг | - | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Восточная Канада | - | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
eastus | - | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | ✅ | - | - | - |
eastus2 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
francecentral | - | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Германия-запад-центр | - | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
северная италия | - | - | - | - | - | ✅ | ✅ | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
japaneast | - | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
koreacentral | - | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
northcentralus | - | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Норвегия-восток | - | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Центральная Польша | - | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
southafricanorth | - | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
southcentralus | - | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Южная Индия | - | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
spaincentral | - | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
SwedenCentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ |
север Швейцарии | - | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
uaenorth | - | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
uksouth | - | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
westeurope | - | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
westus | - | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
westus3 | - | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Примечание.
o1-mini
в настоящее время доступен всем клиентам для глобального стандартного развертывания.
Выбранным клиентам был предоставлен стандартный (региональный) доступ к развертыванию o1-mini
в рамках ограниченного выпуска o1-preview
. В настоящее время доступ к стандартным o1-mini
(региональным) развертываниям не расширяется.
Эта таблица не содержит сведения о точной настройке региональной доступности. Ознакомьтесь с разделом по тонкой настройке для получения этой информации.
Стандартные модели развертывания (региональные) по конечной точке
Завершение чата
Регион | o1-preview, 2024-09-12 | o1-mini, 2024-09-12 | gpt-4o, 2024-05-13 | gpt-4o, 2024-08-06 | gpt-4o, 2024-11-20 | gpt-4o-mini, 2024-07-18 | gpt-4, 0613 | gpt-4, 1106-Preview | gpt-4, 0125-Preview | gpt-4, vision-preview | gpt-4, turbo-2024-04-09 | gpt-4-32k, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 | gpt-35-turbo-16k, 0613 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Австралия Восток | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | - | ✅ | ✅ | ✅ | ✅ |
Восточная Канада | - | - | - | - | - | - | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ |
eastus | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | - | ✅ | - | - | ✅ | ✅ |
eastus2 | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | ✅ | - | - | ✅ | ✅ |
francecentral | - | - | - | - | - | - | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ |
japaneast | - | - | - | - | ✅ | - | - | - | - | ✅ | - | - | - | ✅ | ✅ |
northcentralus | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | - | ✅ | - | - | ✅ | ✅ |
Норвегия-восток | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - |
southcentralus | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | - | ✅ | - | - | ✅ | - |
Южная Индия | - | - | - | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | - |
SwedenCentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
север Швейцарии | - | - | - | - | - | - | ✅ | - | - | ✅ | - | ✅ | - | ✅ | ✅ |
uksouth | - | - | - | - | - | - | - | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ |
westeurope | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - |
westus | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | - |
westus3 | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | - | ✅ | - | - | ✅ | - |
Примечание.
o1-mini
в настоящее время доступен всем клиентам для глобального стандартного развертывания.
Выбранным клиентам был предоставлен стандартный (региональный) доступ к развертыванию o1-mini
в рамках ограниченного выпуска o1-preview
. В настоящее время доступ к стандартным o1-mini
(региональным) развертываниям не расширяется.
Доступность модели GPT-4 и GPT-4 Turbo
Выбор уровня доступа для клиента
Помимо указанных выше регионов, доступных всем клиентам Azure OpenAI, некоторые из них получили доступ к версиям GPT-4 в дополнительных регионах:
Модель | Область/регион |
---|---|
gpt-4 (0314) gpt-4-32k (0314) |
Восточная часть США Центральная Франция Южная часть США южная часть Соединенного Королевства |
gpt-4 (0613) gpt-4-32k (0613) |
Восточная часть США Восточная часть США 2 Восточная Япония южная часть Соединенного Королевства |
Модели GPT-3.5
Ознакомьтесь с версиями моделей, чтобы узнать, как Служба Azure OpenAI обрабатывает обновления версий модели и работает с моделями , чтобы узнать, как просматривать и настраивать параметры версии модели для развертываний GPT-3.5 Turbo.
Тонкая настройка моделей
Примечание.
gpt-35-turbo
— Настройка этой модели ограничена подмножеством регионов и недоступна в каждом регионе, где доступна базовая модель.
Поддерживаемые регионы для точной настройки могут отличаться, если вы используете модели Azure OpenAI в проекте Azure AI Foundry и вне проекта.
Идентификатор модели | Точная настройка регионов | Максимальный запрос (токены) | Учебные данные (вплоть до) |
---|---|---|---|
gpt-35-turbo (1106) |
Восточная часть США2 Северная часть США Центральная Швеция Западная Швейцария |
Входные данные: 16 385 Выходные данные: 4 096 |
Сентябрь 2021 г. |
gpt-35-turbo (0125) |
Восточная часть США2 Северная часть США Центральная Швеция Западная Швейцария |
16,385 | Сентябрь 2021 г. |
gpt-4o-mini (2024-07-18) |
Северная часть США Центральная Швеция |
Входные данные: 128 000 Результат: 16 384 Длина контекста примера обучения: 64 536 |
Октябрь 2023 г. |
gpt-4o (2024-08-06) |
Восточная часть США2 Северная часть США Центральная Швеция |
Входные данные: 128 000 Выходные данные: 16 384 Длина контекста примера обучения: 64 536 |
Октябрь 2023 г. |
Помощники (предварительная версия)
Для Помощников требуется сочетание поддерживаемой модели и поддерживаемого региона. Для некоторых инструментов и возможностей требуются последние модели. Следующие модели доступны в API Помощников, пакете SDK и Azure AI Foundry. Следующая таблица предназначена для оплаты по мере использования. Сведения о доступности единицы выделенной пропускной способности (PTU) см. в статье о выделенной пропускной способности. Перечисленные модели и регионы можно использовать как с помощниками версии 1, так и с версией 2. Вы можете использовать глобальные стандартные модели , если они поддерживаются в перечисленных ниже регионах.
Регион | gpt-4o, 2024-05-13 | gpt-4o, 2024-08-06 | gpt-4o-mini, 2024-07-18 | gpt-4, 0613 | gpt-4, 1106-Preview | gpt-4, 0125-Preview | gpt-4, turbo-2024-04-09 | gpt-4-32k, 0613 | gpt-35-turbo, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 | gpt-35-turbo-16k, 0613 |
---|---|---|---|---|---|---|---|---|---|---|---|---|
Австралия Восток | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ |
eastus | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | ✅ | - | ✅ | ✅ |
eastus2 | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | ✅ | - | ✅ | ✅ |
francecentral | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | ✅ |
japaneast | - | - | - | - | - | - | - | - | ✅ | - | ✅ | ✅ |
Норвегия-восток | - | - | - | - | ✅ | - | - | - | - | - | - | - |
Южная Индия | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | - |
SwedenCentral | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | - | ✅ |
uksouth | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ |
westus | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | - | ✅ | ✅ | - |
westus3 | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | - | - | ✅ | - |
Вывод модели из эксплуатации
Последние сведения о выводе моделей из эксплуатации см. в руководстве по выводу моделей из эксплуатации.