Инференс в Azure AI Foundry

Это первая спецификация Swagger для моделей Azure AI Foundry, специально предназначенная для задач завершения чата. В настоящее время она поддерживает только конечную точку завершения чата.

Этот соединитель доступен в следующих продуктах и регионах:

Услуга Class Регионы
Copilot Studio Стандарт Все регионы Power Automate
Логические приложения Стандарт Все регионы Logic Apps
Power Apps Стандарт Все регионы Power Apps
Power Automate Стандарт Все регионы Power Automate
Контакт
Имя Microsoft
URL https://support.microsoft.com/
Адрес электронной почты abapi@microsoft.com
Метаданные соединителя
Publisher Microsoft
Website https://learn.microsoft.com/en-us/azure/ai-foundry/
Политика конфиденциальности https://privacy.microsoft.com/en-us/privacystatement
Категории AI

Создание подключения

Соединитель поддерживает следующие типы проверки подлинности:

По умолчанию Параметры для создания подключения. Все регионы Доступный для общего пользования

По умолчанию

Применимо: все регионы

Параметры для создания подключения.

Это совместное подключение. Если приложение power app предоставлено другому пользователю, подключение также предоставляется совместно. Дополнительные сведения см. в обзоре соединителей для приложений на основе холста — Power Apps | Документация Майкрософт

Имя Тип Description Обязательно
Целевой универсальный код ресурса (URI) струна Укажите конечную точку вывода для модели Foundry True
Ключ API securestring Ключ API для конечной точки вывода модели True
Имя развертывания модели струна Укажите имя развертывания модели для модели Foundry
Имя базовой модели струна Укажите имя базовой модели для модели Foundry

Ограничения регулирования

Имя Вызовы Период обновления
Вызовы API для каждого подключения 5000 60 секунд

Действия

Создание завершения чата

Создает завершение беседы на основе предоставленных сообщений и конфигурации модели.

Создание завершения чата

Создает завершение беседы на основе предоставленных сообщений и конфигурации модели.

Параметры

Имя Ключ Обязательно Тип Описание
Версия API
api-version string

Версия API, используемая для этой конечной точки завершения чата модели.

роль
role string

Роль отправителя сообщения (например, "пользователь", "помощник").

содержимое
content object
Температура
temperature float

Температура выборки, используемая в диапазоне от 0 до 1. Более высокие значения делают выходные данные более случайными.

top_p
top_p float

Параметр выборки top-p в диапазоне от 0 до 1.

макс_токены
max_tokens integer

Максимальное количество маркеров для создания в ответе.

model
model string

Имя развертывания модели.

Возвращаемое значение

Определения

Выбор

Имя Путь Тип Описание
результаты фильтрации контента
content_filter_results object

Результаты фильтра содержимого, примененного к ответу.

причина окончания
finish_reason string

Причина, по которой модель перестала создавать дополнительные маркеры. Возможные значения включают "stop", "length", "content_filter" и т. д.

index
index integer

Индекс этого выбора в созданном наборе завершений.

logprobs
logprobs string

Вероятности журналов, связанные с каждым маркером в ответе (при запросе).

содержимое
message.content string

Содержимое созданного сообщения в беседе. Это ответ на запрос NL пользователя.

refusal
message.refusal string

Если модель отказывается создавать сообщение, это поле описывает отказ.

роль
message.role string

Роль отправителя сообщения (например, "пользователь", "помощник").

PromptFilterResult

Имя Путь Тип Описание
индекс_подсказки
prompt_index integer

Индекс запроса в исходном вводе.

результаты фильтрации контента
content_filter_results object

Метаданные фильтра содержимого, примененные к запросу.

ЗавершениеTokensDetails

Сведения об использовании маркера для завершения.

Имя Путь Тип Описание
accepted_prediction_tokens
accepted_prediction_tokens integer

Количество маркеров, принятых в качестве допустимых прогнозов для ответа.

токены рассуждений
reasoning_tokens integer

Количество маркеров, используемых для процесса рассудка модели.

rejected_prediction_tokens
rejected_prediction_tokens integer

Количество маркеров, отклоненных во время процесса прогнозирования.

PromptTokensDetails

Сведения о маркерах, используемых в запросе.

Имя Путь Тип Описание
cached_tokens
cached_tokens integer

Количество маркеров, кэшированных и повторно используемых для запроса.

Usage

Сведения об использовании маркеров для запроса, включая как маркеры запроса, так и маркеры завершения.

Имя Путь Тип Описание
токены завершения
completion_tokens integer

Количество маркеров, потребляемых завершением.

детали_токенов_завершения
completion_tokens_details CompletionTokensDetails

Сведения об использовании маркера для завершения.

подсказывающие токены
prompt_tokens integer

Количество маркеров, потребляемых запросом.

prompt_tokens_details
prompt_tokens_details PromptTokensDetails

Сведения о маркерах, используемых в запросе.

общее количество токенов
total_tokens integer

Общее количество маркеров, потребляемых всем запросом (запрос и завершение).

ChatCompletionResponse

Имя Путь Тип Описание
choices
choices array of Choice

Список созданных завершений для заданного запроса.

id
id string

Уникальный идентификатор запроса завершения чата.

model
model string

Модель, используемая для создания завершения чата.

результаты_фильтрации_запросов
prompt_filter_results array of PromptFilterResult

Результаты фильтра содержимого для каждого запроса.

использование
usage Usage

Сведения об использовании маркеров для запроса, включая как маркеры запроса, так и маркеры завершения.