Поделиться через


Модели, доступные в инференсе модели Azure AI

Вывод модели ИИ Azure в Azure AI Foundry предоставляет доступ к флагманским моделям в Azure AI, чтобы использовать их в качестве API без размещения их в инфраструктуре.

Анимация с разделом каталога моделей портала Azure AI Foundry и доступными моделями.

Вы можете просмотреть все модели, доступные в каталоге моделей для портала Azure AI Foundry.

Семейства моделей

Ознакомьтесь со следующими семействами моделей:

Доступность модели варьируется в зависимости от поставщика, SKU развертывания и облака. Все модели, доступные для вычисления моделей Azure AI, поддерживают тип развертывания "глобальный стандарт," который использует глобальный ресурс для обеспечения пропускной способности. Модели Azure OpenAI также поддерживают региональные развертывания и суверенные облака — Azure Government, Azure Germany и Azure China 21Vianet.

Tip

Каталог моделей ИИ Azure предлагает более широкий выбор моделей из большего диапазона поставщиков. Однако для этих моделей может потребоваться разместить их в инфраструктуре, включая создание центра ИИ и проекта. Служба модели ИИ Azure предоставляет способ использования моделей в качестве API без размещения их в инфраструктуре с выставлением счетов по мере использования. Дополнительные сведения о каталоге моделей ИИ Azure.

Лаборатории AI21

The Jamba family models are AI21's production-grade Mamba-based large language model (LLM) which uses AI21's hybrid Mamba-Transformer architecture. It's an instruction-tuned version of AI21's hybrid structured state space model (SSM) transformer Jamba model. Семейные модели Jamba создаются для надежного коммерческого использования с учетом качества и производительности.

Модель Тип Tier Возможности
AI21-Jamba-1.5-Mini завершение чата Глобальный стандарт - Входные данные: текст (262 144 токена)
- Выходные данные: (4096 токенов)
- Языки:en, , fres, ptde, arиhe
- Вызов инструмента: Да
- Форматы ответов: Текст, JSON, структурированные выходные данные
AI21-Jamba-1.5-Large завершение чата Глобальный стандарт - Входные данные: текст (262 144 токена)
- Выходные данные: (4096 токенов)
- Языки:en, , fres, ptde, arиhe
- Вызов инструмента: Да
- Форматы ответов: Текст, JSON, структурированные выходные данные

См . эту коллекцию моделей на портале Azure AI Foundry.

Azure OpenAI

Служба Azure OpenAI предлагает разнообразный набор моделей с разными возможностями и ценовыми точками. Learn more details at Azure OpenAI Model availability. Эти модели включают:

  • Современные модели, разработанные для решения задач рассуждения и решения проблем с повышенной фокусировкой и возможностями
  • Модели, которые могут понять и создать естественный язык и код
  • Модели, которые могут транскрибировать и переводить речь в текст
Модель Тип Tier Возможности
o3-mini chat-completion Глобальный стандарт - Входные данные: текст и изображение (200 000 маркеров)
- Выходные данные: текст (100 000 маркеров)
- Languages:en, it, af, es, de, fr, id, ru, pl, uk, el, lv, zh, ar, tr, ja, sw, cy, ko, is, bn, ur, ne, th, pa, mr, and te.
- Вызов инструмента: Да
- Форматы ответов: Текст, JSON, структурированные выходные данные
o1 завершение чата Глобальный стандарт - Входные данные: текст и изображение (200 000 маркеров)
- Выходные данные: текст (100 000 маркеров)
- Languages:en, it, af, es, de, fr, id, ru, pl, uk, el, lv, zh, ar, tr, ja, sw, cy, ko, is, bn, ur, ne, th, pa, mr, and te.
- Вызов инструмента: Да
- Форматы ответов: Текст, JSON, структурированные выходные данные
o1-preview завершение чата Глобальный стандарт
Стандарт
- Входные данные: текст (128 000 токенов)
- Выходные данные: (32 768 токенов)
- Languages:en, it, af, es, de, fr, id, ru, pl, uk, el, lv, zh, ar, tr, ja, sw, cy, ko, is, bn, ur, ne, th, pa, mr, and te.
- Вызов инструмента: Да
- Форматы ответов: Текст, JSON, структурированные выходные данные
o1-mini chat-completion Глобальный стандарт
Стандарт
- Входные данные: текст (128 000 токенов)
- Выходные данные: (65 536 токенов)
- Languages:en, it, af, es, de, fr, id, ru, pl, uk, el, lv, zh, ar, tr, ja, sw, cy, ko, is, bn, ur, ne, th, pa, mr, and te.
- Tool calling: No
- Форматы ответов: текст
gpt-4o-realtime-preview реальное время Глобальный стандарт - Входные данные: элемент управления, текст и звук (131 072 токенов)
- Выходные данные: текст и звук (16 384 токенов)
- Языки:en
- Вызов инструмента: Да
- Форматы ответов: Текст, JSON
gpt-4o chat-completion Глобальный стандарт
Стандарт
Batch
Provisioned
Global provisioned
Зона данных
- Входные данные: текст и изображение (131 072 токенов)
- Выходные данные: текст (16 384 токенов)
- Languages:en, it, af, es, de, fr, id, ru, pl, uk, el, lv, zh, ar, tr, ja, sw, cy, ko, is, bn, ur, ne, th, pa, mr, and te.
- Вызов инструмента: Да
- Форматы ответов: Текст, JSON, структурированные выходные данные
gpt-4o-mini завершение чата Глобальный стандарт
Стандарт
Batch
Provisioned
Global provisioned
Зона данных
- Входные данные: текст, изображение и звук (131 072 токенов)
- Выходные данные: (16 384 токенов)
- Languages:en, it, af, es, de, fr, id, ru, pl, uk, el, lv, zh, ar, tr, ja, sw, cy, ko, is, bn, ur, ne, th, pa, mr, and te.
- Вызов инструмента: Да
- Форматы ответов: Текст, JSON, структурированные выходные данные
text-embedding-3-large embeddings Глобальный стандарт
Стандарт
Provisioned
Global provisioned
- Входные данные: текст (8 191 токенов)
- Выходные данные: Vector (3072 dim.)
- Языки:en
text-embedding-3-small embeddings Глобальный стандарт
Стандарт
Provisioned
Global provisioned
- Входные данные: текст (8 191 токенов)
- Выходные данные: Vector (1536 dim.)
- Языки:en

См . эту коллекцию моделей на портале Azure AI Foundry.

Cohere

Семейство моделей Cohere включает в себя различные модели, оптимизированные для различных вариантов использования, включая завершение чатов и встраивания. Модели Cohere оптимизированы для различных вариантов использования, включающих причины, сводку и ответы на вопросы.

Модель Тип Tier Возможности
Cohere-command-r-plus-08-2024 завершение чата Глобальный стандарт - Входные данные: текст (131 072 токенов)
- Выходные данные: (4096 токенов)
языки - :en, fr, es, it, de, pt-br, ja, ko, zh-cnи ar
- Вызов инструмента: Да
- Форматы ответов: Текст, JSON
Cohere-command-r-08-2024 завершение чата Глобальный стандарт - Входные данные: текст (131 072 токенов)
- Выходные данные: (4096 токенов)
языки - :en, fr, es, it, de, pt-br, ja, ko, zh-cnи ar
- Вызов инструмента: Да
- Форматы ответов: Текст, JSON
Cohere-command-r-plus
(не рекомендуется)
завершение чата Глобальный стандарт - Входные данные: текст (131 072 токенов)
- Выходные данные: (4096 токенов)
языки - :en, fr, es, it, de, pt-br, ja, ko, zh-cnи ar
- Вызов инструмента: Да
- Форматы ответов: Текст, JSON
Cohere-command-r
(не рекомендуется)
завершение чата Глобальный стандарт - Входные данные: текст (131 072 токенов)
- Выходные данные: (4096 токенов)
языки - :en, fr, es, it, de, pt-br, ja, ko, zh-cnи ar
- Вызов инструмента: Да
- Форматы ответов: Текст, JSON
Cohere-embed-v3-english embeddings
image-embeddings
Глобальный стандарт - Входные данные: текст (512 токенов)
- Output: Vector (1,024 dim.)
- Языки: en
Cohere-embed-v3-многоязычный embeddings
image-embeddings
Глобальный стандарт - Входные данные: текст (512 токенов)
- Output: Vector (1,024 dim.)
языки - :en, fr, es, it, de, pt-br, ja, ko, zh-cnи ar

См . эту коллекцию моделей на портале Azure AI Foundry.

Core42

Core42 includes autoregressive bi-lingual LLMs for Arabic & English with state-of-the-art capabilities in Arabic.

Модель Тип Tier Возможности
jais-30b-chat завершение чата Глобальный стандарт - Входные данные: текст (8 192 токенов)
- Выходные данные: (4096 токенов)
- Языки: en и ar
- Вызов инструмента: Да
- Форматы ответов: Текст, JSON

См . эту коллекцию моделей на портале Azure AI Foundry.

DeepSeek

Семейство моделей DeepSeek включает в себя DeepSeek-R1, которое лучше всего подходит для выполнения задач, используя пошаговый процесс обучения, например язык, научные рассуждения и задачи программирования.

Модель Тип Tier Возможности
DeekSeek-V3-0324 завершение чата Глобальный стандарт - Входные данные: текст (131 072 токенов)
- выходные данные: (131 072 токенов)
- Языки:en и zh
- Вызов инструмента: Нет
- Форматы ответов: Текст, JSON
DeekSeek-R1 завершение чата
(с обоснованием)
Глобальный стандарт - Входные данные: текст (163 840 токенов)
- Выходные данные: (163 840 токенов)
- Языки:en и zh
- Вызов инструментов: Нет
- Форматы ответов: текст.
DeekSeek-V3
(Legacy)
завершение чата Глобальный стандарт - Входные данные: текст (131 072 токенов)
- выходные данные: (131 072 токенов)
- Языки:en и zh
- Вызов инструмента: Нет
- Форматы ответов: Текст, JSON

Для получения руководства по DeepSeek-R1 см. Руководство: Начало работы с моделью рассуждений DeepSeek-R1 в службах анализа модели искусственного интеллекта Azure.

См . эту коллекцию моделей на портале Azure AI Foundry.

Мета

Модели и инструменты Meta Llama — это коллекция предварительно обученных и точно настроенных генеративных моделей ИИ для работы с текстами и изображениями. Диапазон метаданных моделей масштабируется для включения:

  • Small language models (SLMs) like 1B and 3B Base and Instruct models for on-device and edge inferencing
  • Mid-size large language models (LLMs) like 7B, 8B, and 70B Base and Instruct models
  • Высокопроизводительные модели, такие как Meta Llama 3.1-405B Instruct, используются для генерации синтетических данных и сценариев дистилляции.
Модель Тип Tier Возможности
Лама-3.3-70B-Instruct завершение диалога Глобальный стандарт - Входные данные: текст (128 000 токенов)
- Выходные данные: текст (8 192 токенов)
языки - :en, de, fr, it, pt, hi, esи th
- Вызов инструмента: Нет*
- Форматы ответов: текст
Лама-3.2-11B-Vision-Instruct Завершение чата Глобальный стандарт - Входные данные: текст и изображение (128 000 токенов)
- Выходные данные: (8 192 токенов)
- Языки:en
- Вызов инструмента: No*
- Форматы ответов: текст
Лама-3.2-90B-Vision-Instruct завершение чата Глобальный стандарт - Входные данные: текст и изображение (128 000 токенов)
- Выходные данные: (8 192 токенов)
- Языки:en
- Вызов инструмента: Нет*
- Форматы ответов: текст
Meta-Llama-3.1-405B-Instruct chat-completion Глобальный стандарт - Входные данные: текст (131 072 токенов)
- Выходные данные: (8 192 токенов)
языки - :en, de, fr, it, pt, hi, esи th
- Вызов инструментов: No*
- Форматы ответов: текст
Мета-Ллома-3.1-70B-Instruct
(не рекомендуется)
завершение чата Глобальный стандарт - Входные данные: текст (131 072 токенов)
- Выходные данные: (8 192 токенов)
языки - :en, de, fr, it, pt, hi, esи th
- Вызов инструмента: No*
- Форматы ответов: текст
Мета-Ллома-3.1-8B-Instruct завершение чата Глобальный стандарт - Входные данные: текст (131 072 токенов)
- Выходные данные: (8 192 токенов)
языки - :en, de, fr, it, pt, hi, esи th
- Вызов инструмента: Нет*
- Форматы ответов: текст
Мета-Лама-3-70B-Instruct
(не рекомендуется)
завершение чата Глобальный стандарт - Входные данные: текст (8 192 токенов)
- Выходные данные: (8 192 токенов)
- Языки:en
- Tool calling: No*
- Форматы ответов: текст
Мета-Ллома-3-8B-Instruct
(не рекомендуется)
завершение чата Глобальный стандарт - Входные данные: текст (8 192 токенов)
- Выходные данные: (8 192 токенов)
- Языки:en
- Tool calling: Нет*
- Форматы ответов: текст

См . эту коллекцию моделей на портале Azure AI Foundry.

Корпорация Майкрософт

Модели Майкрософт включают различные группы моделей, такие как модели MAI, модели Phi, модели ИИ здравоохранения и многое другое. Чтобы просмотреть все доступные модели Майкрософт, просмотрите коллекцию моделей Майкрософт на портале Azure AI Foundry.

Модель Тип Tier Возможности
MAI-DS-R1 завершение чата
(с обоснованием)
Глобальный стандарт - Входные данные: текст (163 840 токенов)
- Выходные данные: (163 840 токенов)
- Языки:en и zh
- Вызов инструмента: Нет
- Форматы ответов: текст.
Phi-4-mini-instruct Завершение чата Глобальный стандарт - Входные данные: текст (131 072 токенов)
- Выходные данные: (4096 токенов)
языки - :ar, zh, cs, da, nl, en, fi, fr, de, he, hu, it, ja, kono, pl, pt, ru, es, sv, th, trи uk
- Вызов инструмента: Нет
- Форматы ответов: текст
Phi-4-multimodal-instruct завершение чата Глобальный стандарт - Входные данные: текст, изображения и звук (131 072 токенов)
- Выходные данные: (4096 токенов)
языки - :ar, zh, cs, da, nl, en, fi, fr, de, he, hu, it, ja, kono, pl, pt, ru, es, sv, th, trи uk
- Вызов инструмента: Нет
- Форматы ответов: текст
Phi-4 завершение чата Глобальный стандарт - Входные данные: текст (16 384 токенов)
- Выходные данные: (16 384 токенов)
- Языки:en, ar, bn, cs, da, de, el, es, fa, fi, fr, gu, ha, he, hi, hu, id, it, ja, jv, kn, ko, ml, mr, nl, no, or, pa, pl, ps, pt, ro, ru, sv, sw, ta, te, th, tl, tr, uk, ur, vi, yo, и zh
- Вызов инструмента: Нет
- Форматы ответов: текст
Phi-3.5-mini-instruct завершение чата Глобальный стандарт - Входные данные: текст (131 072 токенов)
- Выходные данные: (4096 токенов)
языки - :en, ar, zh, cs, da, nl, fi, fr, de, he, hu, it, ja, kono, pl, pt, ru, es, sv, th, trи uk
- Вызов инструмента: Нет
- Форматы ответов: текст
Phi-3.5-vision-instruct chat-completion Глобальный стандарт - Входные данные: текст и изображение (131 072 токенов)
- Выходные данные: (4096 токенов)
- Языки:en
- Вызов инструмента: Нет
- Форматы ответов: текст
Phi-3.5-MoE-instruct завершение чата Глобальный стандарт - Входные данные: текст (131 072 токенов)
- Выходные данные: текст (4096 токенов)
языки - :en, ar, zh, cs, da, nl, fi, fr, de, he, hu, it, ja, kono, pl, pt, ru, es, sv, th, trи uk
- Вызов инструмента: Нет
- Форматы ответов: текст
Phi-3-mini-128k-instruct chat-completion Глобальный стандарт - Входные данные: текст (131 072 токенов)
- Выходные данные: (4096 токенов)
- Языки:en
- Вызов инструмента: Нет
- Форматы ответов: текст
Phi-3-mini-4k-instruct chat-completion Глобальный стандарт - Входные данные: текст (4096 токенов)
- Выходные данные: (4096 токенов)
- Языки:en
- Tool calling: No
- Форматы ответов: текст
Phi-3-small-8k-instruct chat-completion Глобальный стандарт - Входные данные: текст (131 072 токенов)
- Выходные данные: (4096 токенов)
- Языки:en
- Вызов инструмента: Нет
- Форматы ответов: текст
Phi-3-medium-128k-instruct завершение чата Глобальный стандарт - Входные данные: текст (131 072 токенов)
- Выходные данные: (4096 токенов)
- Языки:en
- Tool calling: No
- Форматы ответов: текст
Phi-3-medium-4k-instruct завершение чата Глобальный стандарт - Входные данные: текст (4096 токенов)
- Выходные данные: (4096 токенов)
- Языки:en
- Tool calling: No
- Форматы ответов: текст
Phi-3-small-128k-instruct завершение чата Глобальный стандарт - Входные данные: текст (131 072 токенов)
- Выходные данные: (4096 токенов)
- Языки:en
- Вызов инструмента: Нет
- Форматы ответов: текст

См . коллекцию моделей Майкрософт на портале Azure AI Foundry.

Мистраль ИИ

Мистраль ИИ предлагает две категории моделей: модели уровня "Премиум", в том числе "Мистраль крупный" и "Мистральные малые" и открытые модели, включая "Мистраль Nemo".

Модель Тип Tier Возможности
Мистраль-малый-2503 завершение чата Глобальный стандарт - Входные данные: текст (32 768 токенов)
- Выходные данные: текст (4096 токенов)
- Языки: fr, de, es, it и en
- Вызов инструмента: Да
- Форматы ответов: Текст, JSON
Mistral-Large-2411 завершение чата Глобальный стандарт - Входные данные: текст (128 000 токенов)
- Выходные данные: текст (4096 токенов)
языки - :en, fr, de, es, it, zh, ja, ko, pt, nlи pl
- Вызов инструмента: Да
- Форматы ответов: Текст, JSON
Codestral-2501 завершение чата Глобальный стандарт - Входные данные: текст (262 144 токена)
- Выходные данные: текст (4096 токенов)
- Языки: en
- Вызов инструмента: Нет
- Форматы ответов: текст
Ministral-3B завершение чата Глобальный стандарт - Входные данные: текст (131 072 токенов)
- Выходные данные: текст (4096 токенов)
- Языки: fr, de, es, it и en
- Вызов инструмента: Да
- Форматы ответов: Текст, JSON
Мистраль-Немо завершение чата Глобальный стандарт - Входные данные: текст (131 072 токенов)
- Выходные данные: текст (4096 токенов)
языки - :en, fr, de, es, it, zh, ja, ko, pt, nlи pl
- Вызов инструмента: Да
- Форматы ответов: Текст, JSON
Мистраль-Ларж-2407
(не рекомендуется)
завершение чата Глобальный стандарт - Входные данные: текст (131 072 токенов)
- Выходные данные: (4096 токенов)
языки - :en, fr, de, es, it, zh, ja, ko, pt, nlи pl
- Вызов инструмента: Да
- Форматы ответов: Текст, JSON
Мистраль-маленький
(не рекомендуется)
завершение чата Глобальный стандарт - Входные данные: текст (32 768 токенов)
- Выходные данные: текст (4096 токенов)
- Языки: fr, de, es, it и en
- Вызов инструмента: Да
- Форматы ответов: Текст, JSON
Mistral-large
(не рекомендуется)
завершение чата Глобальный стандарт - Входные данные: текст (32 768 токенов)
- Выходные данные: (4096 токенов)
- Языки: fr, de, es, it и en
- Вызов инструмента: Да
- Форматы ответов: Текст, JSON

См . эту коллекцию моделей на портале Azure AI Foundry.

NTT Data

tsuzumi — это оптимизированный авторегрессионный языковой преобразователь. Настроенные версии используют контролируемую тонкую настройку (SFT). tsuzumi обрабатывает как японский, так и английский язык с высокой эффективностью.

Модель Тип Tier Возможности
tsuzumi-7b завершение чата Глобальный стандарт - Входные данные: текст (8 192 токенов)
- Выходные данные: текст (8 192 токенов)
- Языки:en и jp
- Вызов инструмента: Нет
- Форматы ответов: текст

Следующие шаги