Инференс в Azure AI Foundry

Это первая спецификация Swagger для моделей Azure AI Foundry, специально предназначенная для задач завершения чата. В настоящее время она поддерживает только конечную точку завершения чата.

Этот соединитель доступен в следующих продуктах и регионах:

Услуга	Class	Регионы
Copilot Studio	Стандарт	Все регионы Power Automate
Логические приложения	Стандарт	Все регионы Logic Apps
Power Apps	Стандарт	Все регионы Power Apps
Power Automate	Стандарт	Все регионы Power Automate

Контакт
Имя	Microsoft
URL	https://support.microsoft.com/
Адрес электронной почты	abapi@microsoft.com

Метаданные соединителя
Publisher	Microsoft
Website	https://learn.microsoft.com/en-us/azure/ai-foundry/
Политика конфиденциальности	https://privacy.microsoft.com/en-us/privacystatement
Категории	AI

Создание подключения

Соединитель поддерживает следующие типы проверки подлинности:


По умолчанию	Параметры для создания подключения.	Все регионы	Доступный для общего пользования

По умолчанию

Применимо: все регионы

Параметры для создания подключения.

Это совместное подключение. Если приложение power app предоставлено другому пользователю, подключение также предоставляется совместно. Дополнительные сведения см. в обзоре соединителей для приложений на основе холста — Power Apps | Документация Майкрософт

Имя	Тип	Description	Обязательно
Целевой универсальный код ресурса (URI)	струна	Укажите конечную точку вывода для модели Foundry	True
Ключ API	securestring	Ключ API для конечной точки вывода модели	True
Имя развертывания модели	струна	Укажите имя развертывания модели для модели Foundry
Имя базовой модели	струна	Укажите имя базовой модели для модели Foundry

Ограничения регулирования

Имя	Вызовы	Период обновления
Вызовы API для каждого подключения	5000	60 секунд

Действия

Создание завершения чата

Создает завершение беседы на основе предоставленных сообщений и конфигурации модели.

Создание завершения чата

Идентификатор операции:: ChatCompletion

Создает завершение беседы на основе предоставленных сообщений и конфигурации модели.

Параметры

Имя	Ключ	Тип	Описание
Версия API	api-version	string	Версия API, используемая для этой конечной точки завершения чата модели.
роль	role	string	Роль отправителя сообщения (например, "пользователь", "помощник").
содержимое	content	object
Температура	temperature	float	Температура выборки, используемая в диапазоне от 0 до 1. Более высокие значения делают выходные данные более случайными.
top_p	top_p	float	Параметр выборки top-p в диапазоне от 0 до 1.
макс_токены	max_tokens	integer	Максимальное количество маркеров для создания в ответе.
model	model	string	Имя развертывания модели.

Возвращаемое значение

Тело: ChatCompletionResponse

Определения

Выбор

Имя	Путь	Тип	Описание
результаты фильтрации контента	content_filter_results	object	Результаты фильтра содержимого, примененного к ответу.
причина окончания	finish_reason	string	Причина, по которой модель перестала создавать дополнительные маркеры. Возможные значения включают "stop", "length", "content_filter" и т. д.
index	index	integer	Индекс этого выбора в созданном наборе завершений.
logprobs	logprobs	string	Вероятности журналов, связанные с каждым маркером в ответе (при запросе).
содержимое	message.content	string	Содержимое созданного сообщения в беседе. Это ответ на запрос NL пользователя.
refusal	message.refusal	string	Если модель отказывается создавать сообщение, это поле описывает отказ.
роль	message.role	string	Роль отправителя сообщения (например, "пользователь", "помощник").

PromptFilterResult

Имя	Путь	Тип	Описание
индекс_подсказки	prompt_index	integer	Индекс запроса в исходном вводе.
результаты фильтрации контента	content_filter_results	object	Метаданные фильтра содержимого, примененные к запросу.

ЗавершениеTokensDetails

Сведения об использовании маркера для завершения.

Имя	Путь	Тип	Описание
accepted_prediction_tokens	accepted_prediction_tokens	integer	Количество маркеров, принятых в качестве допустимых прогнозов для ответа.
токены рассуждений	reasoning_tokens	integer	Количество маркеров, используемых для процесса рассудка модели.
rejected_prediction_tokens	rejected_prediction_tokens	integer	Количество маркеров, отклоненных во время процесса прогнозирования.

PromptTokensDetails

Сведения о маркерах, используемых в запросе.

Имя	Путь	Тип	Описание
cached_tokens	cached_tokens	integer	Количество маркеров, кэшированных и повторно используемых для запроса.

Usage

Сведения об использовании маркеров для запроса, включая как маркеры запроса, так и маркеры завершения.

Имя	Путь	Тип	Описание
токены завершения	completion_tokens	integer	Количество маркеров, потребляемых завершением.
детали_токенов_завершения	completion_tokens_details	CompletionTokensDetails	Сведения об использовании маркера для завершения.
подсказывающие токены	prompt_tokens	integer	Количество маркеров, потребляемых запросом.
prompt_tokens_details	prompt_tokens_details	PromptTokensDetails	Сведения о маркерах, используемых в запросе.
общее количество токенов	total_tokens	integer	Общее количество маркеров, потребляемых всем запросом (запрос и завершение).

ChatCompletionResponse

Имя	Путь	Тип	Описание
choices	choices	array of Choice	Список созданных завершений для заданного запроса.
id	id	string	Уникальный идентификатор запроса завершения чата.
model	model	string	Модель, используемая для создания завершения чата.
результаты_фильтрации_запросов	prompt_filter_results	array of PromptFilterResult	Результаты фильтра содержимого для каждого запроса.
использование	usage	Usage	Сведения об использовании маркеров для запроса, включая как маркеры запроса, так и маркеры завершения.