Azure OpenAI в Microsoft Foundry Models REST API reference (classic)

В настоящее время просмотр:Версия портала Foundry (классическая версия - )Переход на версию для нового портала Foundry

Note

Ссылки в этой статье могут открывать содержимое в новой документации Microsoft Foundry вместо документации по Foundry (классической) сейчас.

В этой статье приведена информация о конечных точках вывода REST API для Azure OpenAI.

API specs

Управление и взаимодействие с моделями и ресурсами Azure OpenAI разделены на три основных поверхности API:

Control plane
Плоскость данных — авторинг
Плоскость данных — вывод

Каждая поверхность/спецификация API инкапсулирует разный набор возможностей Azure OpenAI. Каждый API имеет свой уникальный набор версий предварительного просмотра и стабильных/общедоступных (GA) версий API. В настоящее время превью обычно выходят по ежемесячному ритму.

Important

Теперь появился новый API предпросмотра вывода. Узнайте больше в нашем руководстве по жизненному циклу API.

API	Последний превью релиза	Последний релиз GA	Specifications	Description
Control plane	`2025-07-01-preview`	`2025-06-01`	Spec files	API плоскости управления используется для операций, таких как создание ресурсов, развертывание моделей и другие задачи управления ресурсами высокого уровня. Плоскость управления также регулирует, что можно делать с такими возможностями, как Azure Resource Manager, Bicep, Terraform и Azure CLI.
Data plane	`v1 preview`	`v1`	Spec files	API плоскости данных управляет операциями вывода и авторингом.

Authentication

Azure OpenAI предлагает два метода аутентификации. Вы можете использовать либо API Keys, либо Microsoft Entra ID.

Аутентификация ключа API: для такого типа аутентификации все запросы API должны содержать ключ API в api-key заголовке HTTP. Quickstart предоставляет рекомендации по совершению звонков с помощью такого типа аутентификации.
Microsoft Entra ID аутентификация: Вы можете аутентифицировать вызов API с помощью токена Microsoft Entra. Токены аутентификации включены в запрос в качестве Authorization заголовка. Предоставленный токен должен быть предшествован Bearer, например Bearer YOUR_AUTH_TOKEN, . Вы можете прочитать наше руководство по аутентификации с помощью Microsoft Entra ID.

Версионирование REST API

API сервисов версируются с использованием api-version параметра запроса. Все версии следуют структуре ГГГГMM-DD даты. For example:

POST https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/chat/completions?api-version=2024-06-01

Вывод по плоскости данных

Остальная часть статьи посвящена выпуску GA-спецификации OpenAI для выведения плоскости данных Azure, 2024-10-21.

Если вы ищете документацию по последнему выпуску предварительного просмотра API, обратитесь к последнему API preview data plane inference

Completions

POST https://{endpoint}/openai/deployments/{deployment-id}/completions?api-version=2024-10-21

Создаёт завершение для предоставленного запроса, параметров и выбранной модели.

URI Parameters

Name	In	Required	Type	Description
endpoint	path	Yes	string url	Поддерживается Azure конечных точек OpenAI (протокол и имя хоста, например: `https://aoairesource.openai.azure.com`. Замените «aoairesource» на имя вашего ресурса Azure OpenAI). https://{your-resource-name}.openai.azure.com
deployment-id	path	Yes	string	ID развертывания модели, которая была развернута.
api-version	query	Yes	string	API version

Request Header

Name	Required	Type	Description
api-key	True	string	Предоставьте ключ API Azure OpenAI здесь

Request Body

Content-Type: application/json

Name	Type	Description	Required	Default
prompt	строка или массив	Запрос(ы) для генерации завершений, закодированных как строка, массив строк, массив токенов или массив токенов. Обратите внимание, что <\|endoftext\|> — это разделитель документов, который модель видит во время обучения, поэтому если запрос не указан, модель генерируется как из начала нового документа.	Yes
best_of	integer	Генерирует `best_of` завершения на сервере и возвращает «лучшее» (то, с наибольшей логичной вероятностью на токен). Результаты нельзя транслировать. При использовании с `n`, `best_of` управляет количеством кандидатных завершений и `n` указывает, сколько возвращать â€" `best_of` должно быть больше .`n` Примечание: Поскольку этот параметр генерирует множество завершений, он может быстро поглотить вашу квоту токенов. Используйте внимательно и убедитесь, что у вас есть разумные настройки для `max_tokens` и `stop`.	No	1
echo	boolean	Эхо подскажите заданию в дополнение к завершению	No	False
frequency_penalty	number	Число от -2,0 до 2,0. Положительные значения наказывают новые токены в зависимости от их существующей частоты в тексте, снижая вероятность повторения одной и той же строки дословно.	No	0
logit_bias	object	Измените вероятность появления указанных токенов в завершении. Принимает JSON-объект, который сопоставляет токены (указанные их идентификатором токена в GPT-токенайзере) с соответствующим значением смещения от -100 до 100. Математически смещение добавляется к логитам, генерируемым моделью до выборки. Точный эффект будет различаться в зависимости от модели, но значения между -1 и 1 должны снижать или увеличивать вероятность отбора; Значения вроде -100 или 100 должны привести к бану или эксклюзивному выбору соответствующего токена. Например, вы можете попасть `{"50256": -100}` так, чтобы предотвратить генерацию <токена \|endoftext\|>	No	None
logprobs	integer	Включите логические вероятности для `logprobs` наиболее вероятных выходных токенов, а также выбранные токены. Например, если `logprobs` равен 5, API вернёт список из пяти наиболее вероятных токенов. API всегда вернёт `logprob` сэмплированный токен, поэтому в ответе могут быть элементы `logprobs+1` до предела. Максимальное значение для `logprobs` — 5.	No	None
max_tokens	integer	Максимальное количество токенов, которые могут быть сгенерированы при завершении. Количество токенов в вашем prompt plus `max_tokens` не должно превышать длину контекста модели.	No	16
n	integer	Сколько завершений нужно создавать для каждого запроса. Примечание: Поскольку этот параметр генерирует множество завершений, он может быстро поглотить вашу квоту токенов. Используйте внимательно и убедитесь, что у вас есть разумные настройки для `max_tokens` и `stop`.	No	1
presence_penalty	number	Число от -2,0 до 2,0. Положительные значения наказывают новые токены в зависимости от того, появляются ли они в тексте на данный момент, увеличивая вероятность обсуждения новых тем.	No	0
seed	integer	Если указано, наша система приложит максимум усилий для выборки детерминированно, чтобы повторяющиеся запросы с одинаковыми `seed` параметрами возвращали тот же результат. Детерминизм не гарантирован, и вам следует обращаться к `system_fingerprint` параметру отклика для отслеживания изменений в бэкенде.	No
stop	строка или массив	До четырёх последовательностей, в которых API перестанет генерировать новые токены. Возвращаемый текст не будет содержать последовательность остановки.	No
stream	boolean	Стоит ли возвращаться к частичному прогрессу. Если это установлено, токены будут отправляться в виде событий , отправляемых только на сервер данных, по мере их появления, а поток завершается `data: [DONE]` сообщением.	No	False
suffix	string	Суффикс, который появляется после завершения вставленного текста. Этот параметр поддерживается только для `gpt-3.5-turbo-instruct`.	No	None
temperature	number	Какую температуру использовать — от 0 до 2. Более высокие значения, например 0.8, делают выход более случайным, а низкие, например 0.2, делают его более сфокусированным и детерминированным. Обычно мы рекомендуем менять это или `top_p` не делать и то, и другое.	No	1
top_p	number	Альтернатива выборке с температурой, называемая ядреной выборкой, при которой модель учитывает результаты токенов с top_p вероятностной массой. Таким образом, 0.1 означает, что учитываются только токены, составляющие топ-10% массу вероятности. Обычно мы рекомендуем менять это или `temperature` не делать и то, и другое.	No	1
user	string	Уникальный идентификатор, представляющий вашего конечного пользователя, который помогает отслеживать и выявлять злоупотребления.	No

Responses

Код статуса: 200

Description: OK

Content-Type	Type	Description
application/json	createCompletionResponse	Представляет ответ на завершение от API. Примечание: потоковые и непотоковые объекты ответов имеют одну и ту же форму (в отличие от чат-эндпоинта).

Код статуса: по умолчанию

Описание: Услуга недоступна

Content-Type	Type	Description
application/json	errorResponse

Examples

Example

Создаёт завершение для предоставленного запроса, параметров и выбранной модели.

POST https://{endpoint}/openai/deployments/{deployment-id}/completions?api-version=2024-10-21

{
 "prompt": [
  "tell me a joke about mango"
 ],
 "max_tokens": 32,
 "temperature": 1.0,
 "n": 1
}

Ответы: Код статуса: 200

{
  "body": {
    "id": "cmpl-7QmVI15qgYVllxK0FtxVGG6ywfzaq",
    "created": 1686617332,
    "choices": [
      {
        "text": "es\n\nWhat do you call a mango who's in charge?\n\nThe head mango.",
        "index": 0,
        "finish_reason": "stop",
        "logprobs": null
      }
    ],
    "usage": {
      "completion_tokens": 20,
      "prompt_tokens": 6,
      "total_tokens": 26
    }
  }
}

Embeddings

POST https://{endpoint}/openai/deployments/{deployment-id}/embeddings?api-version=2024-10-21

Получите векторное представление заданного входа, которое легко воспринимается моделями и алгоритмами машинного обучения.

URI Parameters

Name	In	Required	Type	Description
endpoint	path	Yes	string url	Поддерживается Azure конечных точек OpenAI (протокол и имя хоста, например: `https://aoairesource.openai.azure.com`. Замените «aoairesource» на имя вашего ресурса Azure OpenAI). https://{your-resource-name}.openai.azure.com
deployment-id	path	Yes	string
api-version	query	Yes	string	API version

Request Header

Name	Required	Type	Description
api-key	True	string	Предоставьте ключ API Azure OpenAI здесь

Request Body

Content-Type: application/json

Name	Type	Description	Required
input	строка или массив	Вводите текст для вложения, закодированный в виде строки или массива токенов. Чтобы встроить несколько входных данных в один запрос, передайте массив строк или массив токенов. Входные данные не должны превышать максимальные входные токены для модели (8 192 токена для `text-embedding-ada-002`), не может быть пустой строкой, и любой массив должен иметь размерность 2 048 или меньше.	Yes
user	string	Уникальный идентификатор, представляющий вашего конечного пользователя, который помогает отслеживать и выявлять злоупотребления.	No
input_type	string	Тип ввода для поиска вложения для использования	No
encoding_format	string	Формат для возврата встраиваний. Может быть и то, `float` и другое, либо `base64`. По умолчанию — .`float`	No
dimensions	integer	Количество размеров, которые должны иметь полученные вложения. Поддерживается только в `text-embedding-3` и более поздних моделях.	No

Responses

Name	Type	Required
object	string	Yes
model	string	Yes
data	array	Yes
usage	object	Yes

Свойства для использования

prompt_tokens

Name	Type	Description	Default
prompt_tokens	integer

total_tokens

Name	Type	Description	Default
total_tokens	integer

Код статуса: 200

Description: OK

Content-Type	Type	Description
application/json	object

Examples

Example

Верните вложения для заданного запроса.

POST https://{endpoint}/openai/deployments/{deployment-id}/embeddings?api-version=2024-10-21

{
 "input": [
  "this is a test"
 ]
}

Ответы: Код статуса: 200

{
  "body": {
    "data": [
      {
        "index": 0,
        "embedding": [
          -0.012838088,
          -0.007421397,
          -0.017617522,
          -0.028278312,
          -0.018666342,
          0.01737855,
          -0.01821495,
          -0.006950092,
          -0.009937238,
          -0.038580645,
          0.010674067,
          0.02412286,
          -0.013647936,
          0.013189907,
          0.0021125758,
          0.012406612,
          0.020790534,
          0.00074595667,
          0.008397198,
          -0.00535031,
          0.008968075,
          0.014351576,
          -0.014086051,
          0.015055214,
          -0.022211088,
          -0.025198232,
          0.0065186154,
          -0.036350243,
          0.009180495,
          -0.009698266,
          0.009446018,
          -0.008463579,
          -0.0040426035,
          -0.03443847,
          -0.00091273896,
          -0.0019217303,
          0.002349888,
          -0.021560553,
          0.016515596,
          -0.015572986,
          0.0038666942,
          -8.432463e-05
        ]
      }
    ],
    "usage": {
      "prompt_tokens": 4,
      "total_tokens": 4
    }
  }
}

Chat completions

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2024-10-21

Создаёт завершение сообщения в чате

URI Parameters

Name	In	Required	Type	Description
endpoint	path	Yes	string url	Поддерживается Azure конечных точек OpenAI (протокол и имя хоста, например: `https://aoairesource.openai.azure.com`. Замените «aoairesource» на имя вашего ресурса Azure OpenAI). https://{your-resource-name}.openai.azure.com
deployment-id	path	Yes	string	ID развертывания модели, которая была развернута.
api-version	query	Yes	string	API version

Request Header

Name	Required	Type	Description
api-key	True	string	Предоставьте ключ API Azure OpenAI здесь

Request Body

Content-Type: application/json

Name	Type	Description	Required	Default
temperature	number	Какую температуру использовать — от 0 до 2. Более высокие значения, например 0.8, делают выход более случайным, а низкие, например 0.2, делают его более сфокусированным и детерминированным. Обычно мы рекомендуем менять это или `top_p` не делать и то, и другое.	No	1
top_p	number	Альтернатива выборке с температурой, называемая ядреной выборкой, при которой модель учитывает результаты токенов с top_p вероятностной массой. Таким образом, 0.1 означает, что учитываются только токены, составляющие топ-10% массу вероятности. Обычно мы рекомендуем менять это или `temperature` не делать и то, и другое.	No	1
stream	boolean	Если установлено, будут отправляться частичные дельты сообщений, как в ChatGPT. Токены будут отправляться в виде событий , отправляемых только на сервер данных, по мере их появления, при этом поток завершается `data: [DONE]` сообщением.	No	False
stop	строка или массив	До четырёх последовательностей, в которых API перестанет генерировать новые токены.	No
max_tokens	integer	Максимальное количество токенов, которые можно сгенерировать в ходе завершения чата. Общая длина входных и генерируемых токенов ограничена длиной контекста модели.	No
max_completion_tokens	integer	Верхняя граница количества токенов, которые могут быть сгенерированы для завершения, включая видимые выходные токены и токены рассуждения.	No
presence_penalty	number	Число от -2,0 до 2,0. Положительные значения наказывают новые токены в зависимости от того, появляются ли они в тексте на данный момент, увеличивая вероятность обсуждения новых тем.	No	0
frequency_penalty	number	Число от -2,0 до 2,0. Положительные значения наказывают новые токены в зависимости от их существующей частоты в тексте, снижая вероятность повторения одной и той же строки дословно.	No	0
logit_bias	object	Измените вероятность появления указанных токенов в завершении. Принимает JSON-объект, который отображает токены (указанные их идентификатором токена в токенайзере) с соответствующим значением смещения от -100 до 100. Математически смещение добавляется к логитам, генерируемым моделью до выборки. Точный эффект будет различаться в зависимости от модели, но значения между -1 и 1 должны снижать или увеличивать вероятность отбора; Значения вроде -100 или 100 должны привести к бану или эксклюзивному выбору соответствующего токена.	No	None
user	string	Уникальный идентификатор, представляющий вашего конечного пользователя, который помогает отслеживать и выявлять злоупотребления.	No
messages	array	Список сообщений, составляющих разговор на данный момент.	Yes
data_sources	array	Конфигурационные записи для чат-расширений Azure OpenAI, которые их используют. Эта дополнительная спецификация совместима только с Azure OpenAI.	No
logprobs	boolean	Вопрос о том, нужно ли возвращать логические вероятности выходных токенов или нет. Если верно, возвращает логарифмические вероятности каждого выходного токена, возвращаемого в `content` .`message`	No	False
top_logprobs	integer	Целое число от 0 до 20, указывающее число наиболее вероятных токенов для возврата на каждой позиции токена, каждый с соответствующей логарифмической вероятностью. `logprobs` должно быть установлено как `true` , если используется этот параметр.	No
n	integer	Сколько вариантов завершения чата нужно генерировать для каждого вводного сообщения? Обратите внимание, что с вас будет взиматься плата в зависимости от количества сгенерированных токенов во всех вариантах. Держитесь `n` , чтобы `1` минимизировать расходы.	No	1
parallel_tool_calls	ParallelToolCalls	Можно ли включать параллельный вызов функций во время использования инструмента.	No	True
response_format	ResponseFormatText или ResponseFormatJsonObject или ResponseFormatJsonSchema	Объект, указывающий формат, который модель должна вывести. Совместим с GPT-4o, GPT-4o mini, GPT-4 Turbo и всеми моделями GPT-3.5 Turbo новее `gpt-3.5-turbo-1106`. Настройка включает `{ "type": "json_schema", "json_schema": {...} }` структурированные выходы, что гарантирует, что модель будет совпадать с вашей JSON-схемой. Установка включает `{ "type": "json_object" }` режим JSON, который гарантирует, что сообщение, которое генерирует модель, является действительным JSON. Важно: при использовании режима JSON вы также должны инструктировать модель создавать JSON самостоятельно через систему или пользовательское сообщение. Без этого модель может генерировать бесконечный поток пустых пробелов до тех пор, пока генерация не достигнет лимита токенов, что приводит к длительному и, казалось бы, «застрявшему» запросу. Также обратите внимание, что содержимое сообщения может быть частично обрезано, если `finish_reason="length"`, что означает, что генерация превысила `max_tokens` или разговор превысил максимальную длину контекста.	No
seed	integer	Эта функция находится в бета-версии. Если указано, наша система приложит максимум усилий для выборки детерминированно, чтобы повторяющиеся запросы с одинаковыми `seed` параметрами возвращали тот же результат. Детерминизм не гарантирован, и вам следует обращаться к `system_fingerprint` параметру отклика для отслеживания изменений в бэкенде.	No
tools	array	Список инструментов, которые может вызывать модель. В настоящее время поддерживаются только функции как инструменты. Используйте это, чтобы предоставить список функций, для которых модель может генерировать JSON-входы. Поддерживается максимум 128 функций.	No
tool_choice	chatCompletionToolChoiceOption	Управляет, который (если вообще есть) называется моделью. `none` это означает, что модель не вызывает никакой инструмент, а вместо этого генерирует сообщение. `auto` означает, что модель может выбирать между генерацией сообщения и вызовом одного или нескольких инструментов. `required` значит, модель должна вызывать один или несколько инструментов. Указание конкретного инструмента через `{"type": "function", "function": {"name": "my_function"}}` заставляет модель вызывать этот инструмент. `none` является по умолчанию, когда инструменты отсутствуют. `auto` является по умолчанию, если инструменты присутствуют.	No
function_call	строка или chatCompletionFunctionCallOption	Устаревший в пользу `tool_choice`. Управляет, функция которой (если таковая есть) вызывается моделью. `none` означает, что модель не вызывает функцию, а вместо этого генерирует сообщение. `auto` означает, что модель может выбирать между генерированием сообщения и вызовом функции. Определение определённой функции через `{"name": "my_function"}` заставляет модель вызывать эту функцию. `none` является по умолчанию, когда функции отсутствуют. `auto` является по умолчанию, если функции присутствуют.	No
functions	array	Устаревший в пользу `tools`. Список функций, для которых модель может генерировать JSON-входы.	No

Responses

Код статуса: 200

Description: OK

Content-Type	Type	Description
application/json	createChatCompletionResponse или createChatCompletionStreamResponse

Код статуса: по умолчанию

Описание: Услуга недоступна

Content-Type	Type	Description
application/json	errorResponse

Examples

Example

Создаёт завершение для предоставленного запроса, параметров и выбранной модели.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2024-10-21

{
 "messages": [
  {
   "role": "system",
   "content": "you are a helpful assistant that talks like a pirate"
  },
  {
   "role": "user",
   "content": "can you tell me how to care for a parrot?"
  }
 ]
}

Ответы: Код статуса: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Ahoy matey! So ye be wantin' to care for a fine squawkin' parrot, eh? Well, shiver me timbers, let ol' Cap'n Assistant share some wisdom with ye! Here be the steps to keepin' yer parrot happy 'n healthy:\n\n1. Secure a sturdy cage: Yer parrot be needin' a comfortable place to lay anchor! Be sure ye get a sturdy cage, at least double the size of the bird's wingspan, with enough space to spread their wings, yarrrr!\n\n2. Perches 'n toys: Aye, parrots need perches of different sizes, shapes, 'n textures to keep their feet healthy. Also, a few toys be helpin' to keep them entertained 'n their minds stimulated, arrrh!\n\n3. Proper grub: Feed yer feathered friend a balanced diet of high-quality pellets, fruits, 'n veggies to keep 'em strong 'n healthy. Give 'em fresh water every day, or ye\u00e2\u20ac\u2122ll have a scurvy bird on yer hands!\n\n4. Cleanliness: Swab their cage deck! Clean their cage on a regular basis: fresh water 'n food daily, the floor every couple of days, 'n a thorough scrubbing ev'ry few weeks, so the bird be livin' in a tidy haven, arrhh!\n\n5. Socialize 'n train: Parrots be a sociable lot, arrr! Exercise 'n interact with 'em daily to create a bond 'n maintain their mental 'n physical health. Train 'em with positive reinforcement, treat 'em kindly, yarrr!\n\n6. Proper rest: Yer parrot be needin' \u00e2\u20ac\u2122bout 10-12 hours o' sleep each night. Cover their cage 'n let them slumber in a dim, quiet quarter for a proper night's rest, ye scallywag!\n\n7. Keep a weather eye open for illness: Birds be hidin' their ailments, arrr! Be watchful for signs of sickness, such as lethargy, loss of appetite, puffin' up, or change in droppings, and make haste to a vet if need be.\n\n8. Provide fresh air 'n avoid toxins: Parrots be sensitive to draft and pollutants. Keep yer quarters well ventilated, but no drafts, arrr! Be mindful of toxins like Teflon fumes, candles, or air fresheners.\n\nSo there ye have it, me hearty! With proper care 'n commitment, yer parrot will be squawkin' \"Yo-ho-ho\" for many years to come! Good luck, sailor, and may the wind be at yer back!"
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Example

Создаёт завершение на основе данных Azure Search и управляемой идентичности, назначенной системой.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2024-10-21

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a dog?"
  }
 ],
 "data_sources": [
  {
   "type": "azure_search",
   "parameters": {
    "endpoint": "https://your-search-endpoint.search.windows.net/",
    "index_name": "{index name}",
    "authentication": {
     "type": "system_assigned_managed_identity"
    }
   }
  }
 ]
}

Ответы: Код статуса: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion [doc1].",
          "context": {
            "citations": [
              {
                "content": "Citation content.",
                "title": "Citation Title",
                "filepath": "contoso.txt",
                "url": "https://contoso.blob.windows.net/container/contoso.txt",
                "chunk_id": "0"
              }
            ],
            "intent": "dog care"
          }
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Example

Создаёт завершение на основе данных вектора поиска Azure, предыдущего сообщения ассистента и управляемой личности, назначенной пользователем.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2024-10-21

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a cat?"
  },
  {
   "role": "assistant",
   "content": "Content of the completion [doc1].",
   "context": {
    "intent": "cat care"
   }
  },
  {
   "role": "user",
   "content": "how about dog?"
  }
 ],
 "data_sources": [
  {
   "type": "azure_search",
   "parameters": {
    "endpoint": "https://your-search-endpoint.search.windows.net/",
    "authentication": {
     "type": "user_assigned_managed_identity",
     "managed_identity_resource_id": "/subscriptions/{subscription-id}/resourceGroups/{resource-group}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{resource-name}"
    },
    "index_name": "{index name}",
    "query_type": "vector",
    "embedding_dependency": {
     "type": "deployment_name",
     "deployment_name": "{embedding deployment name}"
    },
    "in_scope": true,
    "top_n_documents": 5,
    "strictness": 3,
    "role_information": "You are an AI assistant that helps people find information.",
    "fields_mapping": {
     "content_fields_separator": "\\n",
     "content_fields": [
      "content"
     ],
     "filepath_field": "filepath",
     "title_field": "title",
     "url_field": "url",
     "vector_fields": [
      "contentvector"
     ]
    }
   }
  }
 ]
}

Ответы: Код статуса: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion [doc1].",
          "context": {
            "citations": [
              {
                "content": "Citation content 2.",
                "title": "Citation Title 2",
                "filepath": "contoso2.txt",
                "url": "https://contoso.blob.windows.net/container/contoso2.txt",
                "chunk_id": "0"
              }
            ],
            "intent": "dog care"
          }
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Example

Создаёт завершение для предоставленной Azure Cosmos DB.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2024-10-21

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a dog?"
  }
 ],
 "data_sources": [
  {
   "type": "azure_cosmos_db",
   "parameters": {
    "authentication": {
     "type": "connection_string",
     "connection_string": "mongodb+srv://rawantest:{password}$@{cluster-name}.mongocluster.cosmos.azure.com/?tls=true&authMechanism=SCRAM-SHA-256&retrywrites=false&maxIdleTimeMS=120000"
    },
    "database_name": "vectordb",
    "container_name": "azuredocs",
    "index_name": "azuredocindex",
    "embedding_dependency": {
     "type": "deployment_name",
     "deployment_name": "{embedding deployment name}"
    },
    "fields_mapping": {
     "content_fields": [
      "content"
     ],
     "vector_fields": [
      "contentvector"
     ]
    }
   }
  }
 ]
}

Ответы: Код статуса: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion [doc1].",
          "context": {
            "citations": [
              {
                "content": "Citation content.",
                "title": "Citation Title",
                "filepath": "contoso.txt",
                "url": "https://contoso.blob.windows.net/container/contoso.txt",
                "chunk_id": "0"
              }
            ],
            "intent": "dog care"
          }
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Транскрипции — Создайте

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2024-10-21

Транскрибирует аудио на язык входа.

URI Parameters

Name	In	Required	Type	Description
endpoint	path	Yes	string url	Поддерживается Azure конечных точек OpenAI (протокол и имя хоста, например: `https://aoairesource.openai.azure.com`. Замените «aoairesource» на имя вашего ресурса Azure OpenAI). https://{your-resource-name}.openai.azure.com
deployment-id	path	Yes	string	ID развертывания модели речи в текст. Для информации о поддерживаемых моделях см. [/azure/ai-foundry/openai/concepts/models#audio-models].
api-version	query	Yes	string	API version

Request Header

Name	Required	Type	Description
api-key	True	string	Предоставьте ключ API Azure OpenAI здесь

Request Body

Content-Type: multipart/form-data

Name	Type	Description	Required	Default
file	string	Аудиофайл возражает для транскрибации.	Yes
prompt	string	Необязательный текст для руководства стилем модели или продолжения предыдущего аудиосегмента. Запрос должен соответствовать языку аудио.	No
response_format	audioResponseFormat	Определяет формат выхода.	No
temperature	number	Температура выборки — от 0 до 1. Более высокие значения, например 0.8, делают выход более случайным, а низкие, например 0.2, делают его более сфокусированным и детерминированным. Если установлено в 0, модель будет использовать логарифмическую вероятность для автоматического повышения температуры до достижения определённых порогов.	No	0
language	string	Язык входного аудио. Предоставление языка ввода в формате ISO-639-1 повысит точность и задержку.	No

Responses

Код статуса: 200

Description: OK

Content-Type	Type	Description
application/json	audioResponse или audioVerboseResponse
text/plain	string	Транскрибированный текст в выходном формате (когда response_format был текстом, vtt или srt).

Examples

Example

Получает транскрибированный текст и связанные метаданные из предоставленных аудиоданных.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2024-10-21

Ответы: Код статуса: 200

{
  "body": {
    "text": "A structured object when requesting json or verbose_json"
  }
}

Example

Получает транскрибированный текст и связанные метаданные из предоставленных аудиоданных.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2024-10-21

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

Ответы: Код статуса: 200

{
  "type": "string",
  "example": "plain text when requesting text, srt, or vtt"
}

Переводы - Create

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2024-10-21

Транскрибирует и переводит входные аудиозаписи на английский текст.

URI Parameters

Name	In	Required	Type	Description
endpoint	path	Yes	string url	Поддерживается Azure конечных точек OpenAI (протокол и имя хоста, например: `https://aoairesource.openai.azure.com`. Замените «aoairesource» на имя вашего ресурса Azure OpenAI). https://{your-resource-name}.openai.azure.com
deployment-id	path	Yes	string	ID развертывания модели шепота, которая была развернута. Для информации о поддерживаемых моделях см. [/azure/ai-foundry/openai/concepts/models#audio-models].
api-version	query	Yes	string	API version

Request Header

Name	Required	Type	Description
api-key	True	string	Предоставьте ключ API Azure OpenAI здесь

Request Body

Content-Type: multipart/form-data

Name	Type	Description	Required	Default
file	string	Аудиофайл для перевода.	Yes
prompt	string	Необязательный текст для руководства стилем модели или продолжения предыдущего аудиосегмента. Задание должно быть на английском.	No
response_format	audioResponseFormat	Определяет формат выхода.	No
temperature	number	Температура выборки — от 0 до 1. Более высокие значения, например 0.8, делают выход более случайным, а низкие, например 0.2, делают его более сфокусированным и детерминированным. Если установлено в 0, модель будет использовать логарифмическую вероятность для автоматического повышения температуры до достижения определённых порогов.	No	0

Responses

Код статуса: 200

Description: OK

Content-Type	Type	Description
application/json	audioResponse или audioVerboseResponse
text/plain	string	Транскрибированный текст в выходном формате (когда response_format был текстом, vtt или srt).

Examples

Example

Получает транскрибированный текст на английском языке и связанные с ним метаданные из предоставленных аудиоданных.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2024-10-21

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

Ответы: Код статуса: 200

{
  "body": {
    "text": "A structured object when requesting json or verbose_json"
  }
}

Example

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2024-10-21

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

Ответы: Код статуса: 200

{
  "type": "string",
  "example": "plain text when requesting text, srt, or vtt"
}

Image generation

POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2024-10-21

Генерирует набор изображений из текстовой подписи при заданном развертывании модели dall-e

URI Parameters

Name	In	Required	Type	Description
endpoint	path	Yes	string url	Поддерживается Azure конечных точек OpenAI (протокол и имя хоста, например: `https://aoairesource.openai.azure.com`. Замените «aoairesource» на имя вашего ресурса Azure OpenAI). https://{your-resource-name}.openai.azure.com
deployment-id	path	Yes	string	ID развертывания модели dall-e, которая была развернута.
api-version	query	Yes	string	API version

Request Header

Name	Required	Type	Description
api-key	True	string	Предоставьте ключ API Azure OpenAI здесь

Request Body

Content-Type: application/json

Name	Type	Description	Required	Default
prompt	string	Текстовое описание желаемого изображения(ов). Максимальная длина — 4 000 символов.	Yes
n	integer	Количество изображений для генерации.	No	1
size	imageSize	Размер сгенерированных изображений.	No	1024x1024
response_format	imagesResponseFormat	Формат, в котором возвращаются сгенерированные изображения.	No	url
user	string	Уникальный идентификатор, представляющий вашего конечного пользователя, который помогает отслеживать и выявлять злоупотребления.	No
quality	imageQuality	Качество изображения, которое будет создано.	No	standard
style	imageStyle	Стиль сгенерированных изображений.	No	vivid

Responses

Код статуса: 200

Description: Ok

Content-Type	Type	Description
application/json	generateImagesResponse

Код статуса: по умолчанию

Описание: произошла ошибка.

Content-Type	Type	Description
application/json	dalleErrorResponse

Examples

Example

Создаёт изображения по заданию.

POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2024-10-21

{
 "prompt": "In the style of WordArt, Microsoft Clippy wearing a cowboy hat.",
 "n": 1,
 "style": "natural",
 "quality": "standard"
}

Ответы: Код статуса: 200

{
  "body": {
    "created": 1698342300,
    "data": [
      {
        "revised_prompt": "A vivid, natural representation of Microsoft Clippy wearing a cowboy hat.",
        "prompt_filter_results": {
          "sexual": {
            "severity": "safe",
            "filtered": false
          },
          "violence": {
            "severity": "safe",
            "filtered": false
          },
          "hate": {
            "severity": "safe",
            "filtered": false
          },
          "self_harm": {
            "severity": "safe",
            "filtered": false
          },
          "profanity": {
            "detected": false,
            "filtered": false
          }
        },
        "url": "https://dalletipusw2.blob.core.windows.net/private/images/e5451cc6-b1ad-4747-bd46-b89a3a3b8bc3/generated_00.png?se=2023-10-27T17%3A45%3A09Z&...",
        "content_filter_results": {
          "sexual": {
            "severity": "safe",
            "filtered": false
          },
          "violence": {
            "severity": "safe",
            "filtered": false
          },
          "hate": {
            "severity": "safe",
            "filtered": false
          },
          "self_harm": {
            "severity": "safe",
            "filtered": false
          }
        }
      }
    ]
  }
}

Components

errorResponse

Name	Type	Description	Required	Default
error	error		No

errorBase

Name	Type	Description	Required	Default
code	string		No
message	string		No

error

Name	Type	Description	Required
param	string		No
type	string		No
inner_error	innerError	Внутренняя ошибка с дополнительными деталями.	No

innerError

Внутренняя ошибка с дополнительными деталями.

Name	Type	Description	Required	Default
code	innerErrorCode	Коды ошибок для внутреннего объекта ошибки.	No
content_filter_results	contentFilterPromptResults	Информация о категории фильтрации контента (ненависть, сексуальное, насилие self_harm), выявлена ли она, а также уровень тяжести (very_low, низкий, средний, высокий масштаб, определяющий интенсивность и уровень риска вредного контента) и была ли она отфильтрована. Информация о джейлбрейк-контенте и нецензурной лексике, были ли они обнаружены и были ли отфильтрованы или нет. И информация о списке блокировки клиентов, если он был отфильтрован, и его идентификаторе.	No

innerErrorCode

Коды ошибок для внутреннего объекта ошибки.

Описание: коды ошибок для объекта внутренних ошибок.

Type: string

Default:

Имя enum: InnerErrorCode

Enum Values:

Value	Description
ResponsibleAIPolicyViolation	Запрос нарушал одно из правил фильтрации контента.

dalleErrorResponse

Name	Type	Description	Required	Default
error	dalleError		No

dalleError

Name	Type	Description	Required
param	string		No
type	string		No
inner_error	dalleInnerError	Внутренняя ошибка с дополнительными деталями.	No

dalleInnerError

Внутренняя ошибка с дополнительными деталями.

Name	Type	Description	Required
code	innerErrorCode	Коды ошибок для внутреннего объекта ошибки.	No
content_filter_results	dalleFilterResults	Информация о категории фильтрации контента (ненависть, сексуальное, насилие self_harm), выявлена ли она, а также уровень тяжести (very_low, низкий, средний, высокий масштаб, определяющий интенсивность и уровень риска вредного контента) и была ли она отфильтрована. Информация о джейлбрейк-контенте и нецензурной лексике, были ли они обнаружены и были ли отфильтрованы или нет. И информация о списке блокировки клиентов, если он был отфильтрован, и его идентификаторе.	No
revised_prompt	string	Подсказка, которая использовалась для создания изображения, если произошла какая-либо коррекция.	No

contentFilterResultBase

Name	Type	Description	Required	Default
filtered	boolean		Yes

contentFilterSeverityResult

Name	Type	Description	Required	Default
filtered	boolean		Yes
severity	string		No

contentFilterDetectedResult

Name	Type	Description	Required	Default
filtered	boolean		Yes
detected	boolean		No

contentFilterDetectedWithCitationResult

Name	Type	Description	Required	Default
citation	object		No

Свойства цитирования

URL

Name	Type	Description	Default
URL	string

license

Name	Type	Description	Default
license	string

contentFilterResultsBase

Информация о результатах фильтрации контента.

Name	Type	Required
sexual	contentFilterSeverityResult	No
violence	contentFilterSeverityResult	No
hate	contentFilterSeverityResult	No
self_harm	contentFilterSeverityResult	No
profanity	contentFilterDetectedResult	No
error	errorBase	No

contentFilterPromptResults

Информация о категории фильтрации контента (ненависть, сексуальное, насилие self_harm), выявлена ли она, а также уровень тяжести (very_low, низкий, средний, высокий масштаб, определяющий интенсивность и уровень риска вредного контента) и была ли она отфильтрована. Информация о джейлбрейк-контенте и нецензурной лексике, были ли они обнаружены и были ли отфильтрованы или нет. И информация о списке блокировки клиентов, если он был отфильтрован, и его идентификаторе.

Name	Type	Required
sexual	contentFilterSeverityResult	No
violence	contentFilterSeverityResult	No
hate	contentFilterSeverityResult	No
self_harm	contentFilterSeverityResult	No
profanity	contentFilterDetectedResult	No
error	errorBase	No
jailbreak	contentFilterDetectedResult	No

contentFilterChoiceResults

Информация о категории фильтрации контента (ненависть, сексуальное, насилие self_harm), выявлена ли она, а также уровень тяжести (very_low, низкий, средний, высокий масштаб, определяющий интенсивность и уровень риска вредного контента) и была ли она отфильтрована. Информация о стороннем тексте и нецензурной лексике, обнаружена ли она и была ли отфильтрована или нет. И информация о списке блокировки клиентов, если он был отфильтрован, и его идентификаторе.

Name	Type	Required
sexual	contentFilterSeverityResult	No
violence	contentFilterSeverityResult	No
hate	contentFilterSeverityResult	No
self_harm	contentFilterSeverityResult	No
profanity	contentFilterDetectedResult	No
error	errorBase	No
protected_material_text	contentFilterDetectedResult	No
protected_material_code	contentFilterDetectedWithCitationResult	No

promptFilterResult

Фильтрация контента по одному запросу в запросе.

Name	Type	Description	Required	Default
prompt_index	integer		No
content_filter_results	contentFilterPromptResults	Информация о категории фильтрации контента (ненависть, сексуальное, насилие self_harm), выявлена ли она, а также уровень тяжести (very_low, низкий, средний, высокий масштаб, определяющий интенсивность и уровень риска вредного контента) и была ли она отфильтрована. Информация о джейлбрейк-контенте и нецензурной лексике, были ли они обнаружены и были ли отфильтрованы или нет. И информация о списке блокировки клиентов, если он был отфильтрован, и его идентификаторе.	No

promptFilterResults

Фильтрация контента приводит к нулю или более запросов в запросе. При стриминговом запросе результаты по разным запросам могут приходить в разное время или в разном порядке.

Для этого компонента не определённых свойств.

dalleContentFilterResults

Информация о результатах фильтрации контента.

Name	Type	Required
sexual	contentFilterSeverityResult	No
violence	contentFilterSeverityResult	No
hate	contentFilterSeverityResult	No
self_harm	contentFilterSeverityResult	No

dalleFilterResults

Name	Type	Required
sexual	contentFilterSeverityResult	No
violence	contentFilterSeverityResult	No
hate	contentFilterSeverityResult	No
self_harm	contentFilterSeverityResult	No
profanity	contentFilterDetectedResult	No
jailbreak	contentFilterDetectedResult	No

chatCompletionsRequestCommon

Name	Type	Description	Required	Default
temperature	number	Какую температуру использовать — от 0 до 2. Более высокие значения, например 0.8, делают выход более случайным, а низкие, например 0.2, делают его более сфокусированным и детерминированным. Обычно мы рекомендуем менять это или `top_p` не делать и то, и другое.	No	1
top_p	number	Альтернатива выборке с температурой, называемая ядреной выборкой, при которой модель учитывает результаты токенов с top_p вероятностной массой. Таким образом, 0.1 означает, что учитываются только токены, составляющие топ-10% массу вероятности. Обычно мы рекомендуем менять это или `temperature` не делать и то, и другое.	No	1
stream	boolean	Если установлено, будут отправляться частичные дельты сообщений, как в ChatGPT. Токены будут отправляться в виде событий, отправляемых только на сервер данных, по мере их появления, при этом поток завершается `data: [DONE]` сообщением.	No	False
stop	строка или массив	До четырёх последовательностей, в которых API перестанет генерировать новые токены.	No
max_tokens	integer	Максимальное количество токенов, разрешённое для сгенерированного ответа. По умолчанию количество токенов, которые модель может вернуть, будет (4096 — токены запросов). Сейчас это значение устарело в `max_completion_tokens`пользу , и не совместимо с моделями серии O1.	No	4096
max_completion_tokens	integer	Верхняя граница количества токенов, которые могут быть сгенерированы для завершения, включая видимые выходные токены и токены рассуждения.	No
presence_penalty	number	Число от -2,0 до 2,0. Положительные значения наказывают новые токены в зависимости от того, появляются ли они в тексте на данный момент, увеличивая вероятность обсуждения новых тем.	No	0
frequency_penalty	number	Число от -2,0 до 2,0. Положительные значения наказывают новые токены в зависимости от их существующей частоты в тексте, снижая вероятность повторения одной и той же строки дословно.	No	0
logit_bias	object	Измените вероятность появления указанных токенов в завершении. Принимает объект json, который сопоставляет токены (указанные их идентификатором токена в токенайзере) с соответствующим значением смещения от -100 до 100. Математически смещение добавляется к логитам, генерируемым моделью до выборки. Точный эффект будет различаться в зависимости от модели, но значения между -1 и 1 должны снижать или увеличивать вероятность отбора; Значения вроде -100 или 100 должны привести к бану или эксклюзивному выбору соответствующего токена.	No
user	string	Уникальный идентификатор, представляющий вашего конечного пользователя, который помогает Azure OpenAI отслеживать и выявлять злоупотребления.	No

createCompletionRequest

Name	Type	Description	Required	Default
prompt	строка или массив	Запрос(ы) для генерации завершений, закодированных как строка, массив строк, массив токенов или массив токенов. Обратите внимание, что <\|endoftext\|> — это разделитель документов, который модель видит во время обучения, поэтому если запрос не указан, модель генерируется как из начала нового документа.	Yes
best_of	integer	Генерирует `best_of` завершения на сервере и возвращает «лучшее» (то, с наибольшей логичной вероятностью на токен). Результаты нельзя транслировать. При использовании с `n`, `best_of` управляет количеством кандидатных завершений и `n` указывает, сколько возвращать â€" `best_of` должно быть больше .`n` Примечание: Поскольку этот параметр генерирует множество завершений, он может быстро поглотить вашу квоту токенов. Используйте внимательно и убедитесь, что у вас есть разумные настройки для `max_tokens` и `stop`.	No	1
echo	boolean	Эхо подскажите заданию в дополнение к завершению	No	False
frequency_penalty	number	Число от -2,0 до 2,0. Положительные значения наказывают новые токены в зависимости от их существующей частоты в тексте, снижая вероятность повторения одной и той же строки дословно.	No	0
logit_bias	object	Измените вероятность появления указанных токенов в завершении. Принимает JSON-объект, который сопоставляет токены (указанные их идентификатором токена в GPT-токенайзере) с соответствующим значением смещения от -100 до 100. Математически смещение добавляется к логитам, генерируемым моделью до выборки. Точный эффект будет различаться в зависимости от модели, но значения между -1 и 1 должны снижать или увеличивать вероятность отбора; Значения вроде -100 или 100 должны привести к бану или эксклюзивному выбору соответствующего токена. Например, вы можете попасть `{"50256": -100}` так, чтобы предотвратить генерацию <токена \|endoftext\|>	No	None
logprobs	integer	Включите логические вероятности для `logprobs` наиболее вероятных выходных токенов, а также выбранные токены. Например, если `logprobs` равен 5, API вернёт список из пяти наиболее вероятных токенов. API всегда вернёт `logprob` сэмплированный токен, поэтому в ответе могут быть элементы `logprobs+1` до предела. Максимальное значение для `logprobs` — 5.	No	None
max_tokens	integer	Максимальное количество токенов, которые могут быть сгенерированы при завершении. Количество токенов в вашем prompt plus `max_tokens` не должно превышать длину контекста модели.	No	16
n	integer	Сколько завершений нужно создавать для каждого запроса. Примечание: Поскольку этот параметр генерирует множество завершений, он может быстро поглотить вашу квоту токенов. Используйте внимательно и убедитесь, что у вас есть разумные настройки для `max_tokens` и `stop`.	No	1
presence_penalty	number	Число от -2,0 до 2,0. Положительные значения наказывают новые токены в зависимости от того, появляются ли они в тексте на данный момент, увеличивая вероятность обсуждения новых тем.	No	0
seed	integer	Если указано, наша система приложит максимум усилий для выборки детерминированно, чтобы повторяющиеся запросы с одинаковыми `seed` параметрами возвращали тот же результат. Детерминизм не гарантирован, и вам следует обращаться к `system_fingerprint` параметру отклика для отслеживания изменений в бэкенде.	No
stop	строка или массив	До четырёх последовательностей, в которых API перестанет генерировать новые токены. Возвращаемый текст не будет содержать последовательность остановки.	No
stream	boolean	Стоит ли возвращаться к частичному прогрессу. Если это установлено, токены будут отправляться в виде событий , отправляемых только на сервер данных, по мере их появления, а поток завершается `data: [DONE]` сообщением.	No	False
suffix	string	Суффикс, который появляется после завершения вставленного текста. Этот параметр поддерживается только для `gpt-3.5-turbo-instruct`.	No	None
temperature	number	Какую температуру использовать — от 0 до 2. Более высокие значения, например 0.8, делают выход более случайным, а низкие, например 0.2, делают его более сфокусированным и детерминированным. Обычно мы рекомендуем менять это или `top_p` не делать и то, и другое.	No	1
top_p	number	Альтернатива выборке с температурой, называемая ядреной выборкой, при которой модель учитывает результаты токенов с top_p вероятностной массой. Таким образом, 0.1 означает, что учитываются только токены, составляющие топ-10% массу вероятности. Обычно мы рекомендуем менять это или `temperature` не делать и то, и другое.	No	1
user	string	Уникальный идентификатор, представляющий вашего конечного пользователя, который помогает отслеживать и выявлять злоупотребления.	No

createCompletionResponse

Представляет ответ на завершение от API. Примечание: потоковые и непотоковые объекты ответов имеют одну и ту же форму (в отличие от чат-эндпоинта).

Name	Type	Description	Required
id	string	Уникальный идентификатор для завершения.	Yes
choices	array	Список вариантов завершения, который модель генерировала для входного запроса.	Yes
created	integer	Временная метка Unix (в секундах) момента создания завершения.	Yes
model	string	Модель, использованная для завершения.	Yes
prompt_filter_results	promptFilterResults	Фильтрация контента приводит к нулю или более запросов в запросе. При стриминговом запросе результаты по разным запросам могут приходить в разное время или в разном порядке.	No
system_fingerprint	string	Этот отпечаток отпечатка отражает конфигурацию бэкенда, с которой работает модель. Может использоваться вместе с параметром `seed` запроса для понимания, когда были внесены изменения в бэкенде, которые могут повлиять на детерминизм.	No
object	enum	Тип объекта, который всегда «text_completion» Возможные значения: text_completion	Yes
usage	completionUsage	Статистика использования для запроса на завершение.	No

createChatCompletionRequest

Name	Type	Description	Required	Default
temperature	number	Какую температуру использовать — от 0 до 2. Более высокие значения, например 0.8, делают выход более случайным, а низкие, например 0.2, делают его более сфокусированным и детерминированным. Обычно мы рекомендуем менять это или `top_p` не делать и то, и другое.	No	1
top_p	number	Альтернатива выборке с температурой, называемая ядреной выборкой, при которой модель учитывает результаты токенов с top_p вероятностной массой. Таким образом, 0.1 означает, что учитываются только токены, составляющие топ-10% массу вероятности. Обычно мы рекомендуем менять это или `temperature` не делать и то, и другое.	No	1
stream	boolean	Если установлено, будут отправляться частичные дельты сообщений, как в ChatGPT. Токены будут отправляться в виде событий , отправляемых только на сервер данных, по мере их появления, при этом поток завершается `data: [DONE]` сообщением.	No	False
stop	строка или массив	До четырёх последовательностей, в которых API перестанет генерировать новые токены.	No
max_tokens	integer	Максимальное количество токенов, которые можно сгенерировать в ходе завершения чата. Общая длина входных и генерируемых токенов ограничена длиной контекста модели.	No
max_completion_tokens	integer	Верхняя граница количества токенов, которые могут быть сгенерированы для завершения, включая видимые выходные токены и токены рассуждения.	No
presence_penalty	number	Число от -2,0 до 2,0. Положительные значения наказывают новые токены в зависимости от того, появляются ли они в тексте на данный момент, увеличивая вероятность обсуждения новых тем.	No	0
frequency_penalty	number	Число от -2,0 до 2,0. Положительные значения наказывают новые токены в зависимости от их существующей частоты в тексте, снижая вероятность повторения одной и той же строки дословно.	No	0
logit_bias	object	Измените вероятность появления указанных токенов в завершении. Принимает JSON-объект, который отображает токены (указанные их идентификатором токена в токенайзере) с соответствующим значением смещения от -100 до 100. Математически смещение добавляется к логитам, генерируемым моделью до выборки. Точный эффект будет различаться в зависимости от модели, но значения между -1 и 1 должны снижать или увеличивать вероятность отбора; Значения вроде -100 или 100 должны привести к бану или эксклюзивному выбору соответствующего токена.	No	None
user	string	Уникальный идентификатор, представляющий вашего конечного пользователя, который помогает отслеживать и выявлять злоупотребления.	No
messages	array	Список сообщений, составляющих разговор на данный момент.	Yes
data_sources	array	Конфигурационные записи для чат-расширений Azure OpenAI, которые их используют. Эта дополнительная спецификация совместима только с Azure OpenAI.	No
logprobs	boolean	Вопрос о том, нужно ли возвращать логические вероятности выходных токенов или нет. Если верно, возвращает логарифмические вероятности каждого выходного токена, возвращаемого в `content` .`message`	No	False
top_logprobs	integer	Целое число от 0 до 20, указывающее число наиболее вероятных токенов для возврата на каждой позиции токена, каждый с соответствующей логарифмической вероятностью. `logprobs` должно быть установлено как `true` , если используется этот параметр.	No
n	integer	Сколько вариантов завершения чата нужно генерировать для каждого вводного сообщения? Обратите внимание, что с вас будет взиматься плата в зависимости от количества сгенерированных токенов во всех вариантах. Держитесь `n` , чтобы `1` минимизировать расходы.	No	1
parallel_tool_calls	ParallelToolCalls	Можно ли включать параллельный вызов функций во время использования инструмента.	No	True
response_format	ResponseFormatText или ResponseFormatJsonObject или ResponseFormatJsonSchema	Объект, указывающий формат, который модель должна вывести. Совместим с GPT-4o, GPT-4o mini, GPT-4 Turbo и всеми моделями GPT-3.5 Turbo новее `gpt-3.5-turbo-1106`. Настройка включает `{ "type": "json_schema", "json_schema": {...} }` структурированные выходы, что гарантирует, что модель будет совпадать с вашей JSON-схемой. Установка включает `{ "type": "json_object" }` режим JSON, который гарантирует, что сообщение, которое генерирует модель, является действительным JSON. Важно: при использовании режима JSON вы также должны инструктировать модель создавать JSON самостоятельно через систему или пользовательское сообщение. Без этого модель может генерировать бесконечный поток пустых пробелов до тех пор, пока генерация не достигнет лимита токенов, что приводит к длительному и, казалось бы, «застрявшему» запросу. Также обратите внимание, что содержимое сообщения может быть частично обрезано, если `finish_reason="length"`, что означает, что генерация превысила `max_tokens` или разговор превысил максимальную длину контекста.	No
seed	integer	Эта функция находится в бета-версии. Если указано, наша система приложит максимум усилий для выборки детерминированно, чтобы повторяющиеся запросы с одинаковыми `seed` параметрами возвращали тот же результат. Детерминизм не гарантирован, и вам следует обращаться к `system_fingerprint` параметру отклика для отслеживания изменений в бэкенде.	No
tools	array	Список инструментов, которые может вызывать модель. В настоящее время поддерживаются только функции как инструменты. Используйте это, чтобы предоставить список функций, для которых модель может генерировать JSON-входы. Поддерживается максимум 128 функций.	No
tool_choice	chatCompletionToolChoiceOption	Управляет, который (если вообще есть) называется моделью. `none` это означает, что модель не вызывает никакой инструмент, а вместо этого генерирует сообщение. `auto` означает, что модель может выбирать между генерацией сообщения и вызовом одного или нескольких инструментов. `required` значит, модель должна вызывать один или несколько инструментов. Указание конкретного инструмента через `{"type": "function", "function": {"name": "my_function"}}` заставляет модель вызывать этот инструмент. `none` является по умолчанию, когда инструменты отсутствуют. `auto` является по умолчанию, если инструменты присутствуют.	No
function_call	строка или chatCompletionFunctionCallOption	Устаревший в пользу `tool_choice`. Управляет, функция которой (если таковая есть) вызывается моделью. `none` означает, что модель не вызывает функцию, а вместо этого генерирует сообщение. `auto` означает, что модель может выбирать между генерированием сообщения и вызовом функции. Определение определённой функции через `{"name": "my_function"}` заставляет модель вызывать эту функцию. `none` является по умолчанию, когда функции отсутствуют. `auto` является по умолчанию, если функции присутствуют.	No
functions	array	Устаревший в пользу `tools`. Список функций, для которых модель может генерировать JSON-входы.	No

chatCompletionFunctions

Name	Type	Description	Required
description	string	Описание того, что делает функция, используемое моделью для выбора, когда и как вызывать функцию.	No
name	string	Название функции, которую нужно вызвать. Должны быть a-z, A-Z, 0-9, или содержать подчёркивания и тире, максимальная длина — 64.	Yes
parameters	FunctionParameters	Параметры, которые принимают функции, описываются как объект схемы JSON. Смотрите руководство для примеров и справочник JSON Schema для документации по формату. Опущение `parameters` определяет функцию с пустым списком параметров.	No

chatCompletionFunctionCallOption

Определение определённой функции через {"name": "my_function"} заставляет модель вызывать эту функцию.

Name	Type	Description	Required	Default
name	string	Название функции для вызова.	Yes

chatCompletionRequestMessage

Этот компонент может быть одним из следующих:

chatCompletionRequestSystemMessage

Name	Type	Description	Required
content	строка или массив	Содержимое системного сообщения.	Yes
role	enum	Роль автора сообщений, в данном `system`случае . Возможные значения: система	Yes
name	string	Необязательное имя для участника. Предоставляет информацию о модели для различия участников одной и той же роли.	No

chatCompletionRequestUserMessage

Name	Type	Description	Required
content	строка или массив	Содержимое пользовательского сообщения.	Yes
role	enum	Роль автора сообщений, в данном `user`случае . Возможные значения: пользователь	Yes
name	string	Необязательное имя для участника. Предоставляет информацию о модели для различия участников одной и той же роли.	No

chatCompletionRequestAssistantMessage

Name	Type	Description	Required
content	строка или массив	Содержимое сообщения от помощника. Обязательно, если только `tool_calls` не указано или `function_call` не указано.	No
refusal	string	Сообщение об отказе от ассистента.	No
role	enum	Роль автора сообщений, в данном `assistant`случае . Возможные значения: ассистент	Yes
name	string	Необязательное имя для участника. Предоставляет информацию о модели для различия участников одной и той же роли.	No
tool_calls	chatCompletionMessageToolCalls	Вызовы инструментов, генерируемые моделью, такие как вызовы функций.	No
function_call	object	Устаревший и заменённый на `tool_calls`. Имя и аргументы функции, которую следует вызвать, как они генерируются моделью.	No

Свойства для function_call

arguments

Name	Type	Description	Default
arguments	string	Аргументы для вызова функции, сгенерированные моделью в формате JSON. Обратите внимание, что модель не всегда генерирует валидный JSON и может генерировать параметры, не определённые вашей схемой функций. Проверьте аргументы в коде перед вызовом функции.

name

Name	Type	Description	Default
name	string	Название функции для вызова.

chatCompletionRequestToolMessage

Name	Type	Description	Required
role	enum	Роль автора сообщений, в данном `tool`случае . Возможные значения: инструмент	Yes
content	строка или массив	Содержимое сообщения инструмента.	Yes
tool_call_id	string	Вызов инструмента, на который отвечает это сообщение.	Yes

chatCompletionRequestFunctionMessage

Name	Type	Description	Required
role	enum	Роль автора сообщений, в данном `function`случае . Возможные значения: функция	Yes
content	string	Содержимое сообщения функции.	Yes
name	string	Название функции для вызова.	Yes

chatCompletionRequestSystemMessageContentPart

Этот компонент может быть одним из следующих:

chatCompletionRequestUserMessageContentPart

Этот компонент может быть одним из следующих:

chatCompletionRequestAssistantMessageContentPart

Этот компонент может быть одним из следующих:

chatCompletionRequestToolMessageContentPart

Этот компонент может быть одним из следующих:

chatCompletionRequestMessageContentPartText

Name	Type	Description	Required	Default
type	enum	Тип контента. Возможные значения: текст	Yes
text	string	Содержание текста.	Yes

chatCompletionRequestMessageContentPartImage

Name	Type	Description	Required	Default
type	enum	Тип контента. Возможные значения: image_url	Yes
image_url	object		Yes

Свойства для image_url

url

Name	Type	Description	Default
url	string	Либо URL изображения, либо данные изображения, закодированные в base64.

detail

Name	Type	Description	Default
detail	string	Указывает уровень детализации изображения. Узнайте больше в руководстве Vision.	auto

chatCompletionRequestMessageContentPartRefusal

Name	Type	Description	Required	Default
type	enum	Тип контента. Возможные значения: отказ	Yes
refusal	string	Сообщение об отказе, генерируемое моделью.	Yes

azureChatExtensionConfiguration

Представление конфигурационных данных для одного расширения чата Azure OpenAI. Это будет использоваться для запроса на завершение чата, который должен использовать расширения чата Azure OpenAI для усиления поведения ответа. Использование этой конфигурации совместимо только с Azure OpenAI.

Name	Type	Description	Required	Default
type	azureChatExtensionType	Представление конфигурационных данных для одного расширения чата Azure OpenAI. Это будет использоваться в чате Запрос на завершение, которые должны использовать расширения чата Azure OpenAI для усиления поведения ответа. Использование этой конфигурации совместимо только с Azure OpenAI.	Yes

azureChatExtensionType

Описание: Представление конфигурационных данных для одного расширения чата Azure OpenAI. Это будет использоваться для запроса на завершение чата, который должен использовать расширения чата Azure OpenAI для усиления поведения ответа. Использование этой конфигурации совместимо только с Azure OpenAI.

Type: string

Default:

Enum Name: AzureChatExtensionType

Enum Values:

Value	Description
azure_search	Представляет использование Azure Search как расширения чата Azure OpenAI.
azure_cosmos_db	Представляет использование Azure Cosmos DB в качестве расширения для чата Azure OpenAI.

azureSearchChatExtensionConfiguration

Конкретное представление настраиваемых опций для Azure Search при использовании его в качестве расширения чата Azure OpenAI.

Name	Type	Description	Required	Default
type	azureChatExtensionType	Представление конфигурационных данных для одного расширения чата Azure OpenAI. Это будет использоваться в чате Запрос на завершение, которые должны использовать расширения чата Azure OpenAI для усиления поведения ответа. Использование этой конфигурации совместимо только с Azure OpenAI.	Yes
parameters	azureSearchChatExtensionParameters	Параметры для Azure Search при использовании в качестве расширения чата Azure OpenAI.	No

azureSearchChatExtensionParameters

Параметры для Azure Search при использовании в качестве расширения чата Azure OpenAI.

Name	Type	Description	Required
authentication	onYourDataApiKeyAuthenticationOptions или onYourDataSystemAssignedManagedIdentityAuthenticationOptions или onYourDataUserAssignedManagedIdentityAuthenticationOptions или onYourDataUserAssignedManagedIdentityAuthenticationOptions.		Yes
top_n_documents	integer	Настроенное максимальное количество документов для настроенного запроса.	No
in_scope	boolean	Следует ли ограничивать запросы использованием индексированных данных.	No
strictness	integer	Настроенная строгость фильтрации релевантности поиска. Чем выше строгость, тем выше точность, но меньше запоминания ответа.	No
role_information	string	Дайте модели инструкции о том, как она должна вести себя и какой контекст должна ссылаться при генерации ответа. Вы можете описать характер ассистента и объяснить, как правильно оформлять ответы. Для него есть лимит в 100 токенов, и он засчитывается к общему лимиту токенов.	No
endpoint	string	Абсолютный путь конечной точки, который может использовать ресурс Azure Search.	Yes
index_name	string	Название индекса для использования, как оно доступно в упомянутом ресурсе Azure Search.	Yes
fields_mapping	azureSearchIndexFieldMappingOptions	Опциональные настройки для управления обработкой полей при использовании настроенного ресурса поиска Azure.	No
query_type	azureSearchQueryType	Тип поискового запроса в Azure Search, который должен выполняться при использовании его в качестве расширения чата Azure OpenAI.	No
semantic_configuration	string	Дополнительная семантическая конфигурация запроса.	No
filter	string	Search filter.	No
embedding_dependency	onYourDataEndpointVectorizationSource или onYourDataDeploymentNameVectorizationSource		No

azureSearchIndexFieldMappingOptions

Опциональные настройки для управления обработкой полей при использовании настроенного ресурса поиска Azure.

Name	Type	Description	Required
title_field	string	Название индексного поля для заголовка.	No
url_field	string	Название индексного поля для использования в качестве URL.	No
filepath_field	string	Название индексного поля для использования в качестве пути к файлу.	No
content_fields	array	Имена индексных полей, которые должны рассматриваться как содержимое.	No
content_fields_separator	string	Шаблон разделителя, который должны использовать поля содержания.	No
vector_fields	array	Названия полей, представляющих векторные данные.	No

azureSearchQueryType

Тип поискового запроса в Azure Search, который должен выполняться при использовании его в качестве расширения чата Azure OpenAI.

Description: тип поискового запроса Azure Search, который должен выполняться при использовании в качестве расширения чата Azure OpenAI.

Type: string

Default:

Enum Name: AzureSearchQueryType

Enum Values:

Value	Description
simple	Представляет собой простой парсер запросов по умолчанию.
semantic	Представляет парсер семантических запросов для расширенного семантического моделирования.
vector	Представляет векторный поиск по вычисленным данным.
vector_simple_hybrid	Представляет собой сочетание простой стратегии запроса с векторными данными.
vector_semantic_hybrid	Представляет собой сочетание семантического поиска и векторных запросов по данным.

azureCosmosDBChatExtensionConfiguration

Специфическое представление конфигурируемых опций для Azure Cosmos DB при использовании её в качестве расширения чата Azure OpenAI.

Name	Type	Description	Required	Default
type	azureChatExtensionType	Представление конфигурационных данных для одного расширения чата Azure OpenAI. Это будет использоваться в чате Запрос на завершение, которые должны использовать расширения чата Azure OpenAI для усиления поведения ответа. Использование этой конфигурации совместимо только с Azure OpenAI.	Yes
parameters	azureCosmosDBChatExtensionParameters	Параметры для использования при конфигурировании Azure OpenAI On Your Data chat extensions при использовании Azure Cosmos DB для MongoDB vCore.	No

azureCosmosDBChatExtensionParameters

Параметры для использования при конфигурировании Azure OpenAI на расширениях чата Your Data при использовании Azure Cosmos DB for MongoDB vCore.

Name	Type	Description	Required
authentication	onYourDataConnectionStringAuthenticationOptions	Опции аутентификации для Azure OpenAI On Your Data при использовании строка подключения.	Yes
top_n_documents	integer	Настроенное максимальное количество документов для настроенного запроса.	No
in_scope	boolean	Следует ли ограничивать запросы использованием индексированных данных.	No
strictness	integer	Настроенная строгость фильтрации релевантности поиска. Чем выше строгость, тем выше точность, но меньше запоминания ответа.	No
role_information	string	Дайте модели инструкции о том, как она должна вести себя и какой контекст должна ссылаться при генерации ответа. Вы можете описать характер ассистента и объяснить, как правильно оформлять ответы. Для него есть лимит в 100 токенов, и он засчитывается к общему лимиту токенов.	No
database_name	string	Имя базы данных MongoDB vCore для использования с Azure Cosmos DB.	Yes
container_name	string	Название контейнера ресурсов Azure Cosmos DB.	Yes
index_name	string	Имя индекса MongoDB vCore для использования с Azure Cosmos DB.	Yes
fields_mapping	azureCosmosDBFieldMappingOptions	Опциональные настройки для управления обработкой полей при использовании настроенного ресурса Azure Cosmos DB.	Yes
embedding_dependency	onYourDataEndpointVectorizationSource или onYourDataDeploymentNameVectorizationSource		Yes

azureCosmosDBFieldMappingOptions

Опциональные настройки для управления обработкой полей при использовании настроенного ресурса Azure Cosmos DB.

Name	Type	Description	Required
title_field	string	Название индексного поля для заголовка.	No
url_field	string	Название индексного поля для использования в качестве URL.	No
filepath_field	string	Название индексного поля для использования в качестве пути к файлу.	No
content_fields	array	Имена индексных полей, которые должны рассматриваться как содержимое.	Yes
content_fields_separator	string	Шаблон разделителя, который должны использовать поля содержания.	No
vector_fields	array	Названия полей, представляющих векторные данные.	Yes

onYourDataAuthenticationOptions

Опции аутентификации для Azure OpenAI на ваших данных.

Name	Type	Description	Required	Default
type	onYourDataAuthenticationType	Типы аутентификации, поддерживаемые Azure OpenAI на ваших данных.	Yes

onYourDataAuthenticationType

Типы аутентификации, поддерживаемые Azure OpenAI на ваших данных.

Описание: Типы аутентификации, поддерживаемые Azure OpenAI On Your Data.

Type: string

Default:

Имя enum: OnYourDataAuthenticationType

Enum Values:

Value	Description
api_key	Аутентификация с помощью API-ключа.
connection_string	Аутентификация через строка подключения.
system_assigned_managed_identity	Аутентификация с помощью управляемой идентификации, назначенной системой.
user_assigned_managed_identity	Аутентификация с помощью управляемой личности, назначенной пользователем.

onYourDataApiKeyAuthenticationOptions

Опции аутентификации для Azure OpenAI на ваших данных при использовании ключа API.

Name	Type	Description	Required	Default
type	onYourDataAuthenticationType	Типы аутентификации, поддерживаемые Azure OpenAI на ваших данных.	Yes
key	string	Ключ API для аутентификации.	No

onYourDataConnectionStringAuthenticationOptions

Опции аутентификации для Azure OpenAI On Your Data при использовании строка подключения.

Name	Type	Description	Required	Default
type	onYourDataAuthenticationType	Типы аутентификации, поддерживаемые Azure OpenAI на ваших данных.	Yes
connection_string	string	Это строка подключения для аутентификации.	No

onYourDataSystemAssignedManagedIdentityAuthenticationOptions

Опции аутентификации для Azure OpenAI на ваших данных при использовании управляемой идентичности, назначенной системой.

Name	Type	Description	Required	Default
type	onYourDataAuthenticationType	Типы аутентификации, поддерживаемые Azure OpenAI на ваших данных.	Yes

onYourDataUserAssignedManagedIdentityAuthenticationOptions

Опции аутентификации для Azure OpenAI на ваших данных при использовании управляемой личности, назначенной пользователем.

Name	Type	Description	Required	Default
type	onYourDataAuthenticationType	Типы аутентификации, поддерживаемые Azure OpenAI на ваших данных.	Yes
managed_identity_resource_id	string	Идентификатор ресурса управляемой личности, назначенной пользователем для аутентификации.	No

onYourDataVectorizationSource

Абстрактное представление источника векторизации для Azure OpenAI On Your Data с векторным поиском.

Name	Type	Description	Required	Default
type	onYourDataVectorizationSourceType	Представляет доступные источники, которые Azure OpenAI On Your Data может использовать для настройки векторизации данных для использования с vector search.	Yes

onYourDataVectorizationSourceType

Представляет доступные источники, которые Azure OpenAI On Your Data может использовать для настройки векторизации данных для использования с векторным поиском.

Description: Представляет доступные источники, Azure OpenAI On Your Data может использовать для настройки векторизации данных для использования с
vector search.

Type: string

Default:

Имя enum: OnYourDataVectorizationSourceType

Enum Values:

Value

Description

endpoint

Представляет векторизацию, выполняемую вызовами публичных сервисов в модель вложения Azure OpenAI.

deployment_name

Представляет имя развертывания модели Ada для использования. Развертывание этой модели должно быть в том же ресурсе Azure OpenAI, но
On Your Data будет использовать эту модель для развертывания через внутренний вызов, а не публичный, что позволяет использовать вектор
Ищите даже в частных сетях.

onYourDataDeploymentNameVectorizationSource

Детали источника векторизации, используемого Azure OpenAI On Your Data при применении векторного поиска, основанного на внутреннем имени модели развертывания в том же ресурсе Azure OpenAI.

Name	Type	Description	Required	Default
type	onYourDataVectorizationSourceType	Представляет доступные источники, которые Azure OpenAI On Your Data может использовать для настройки векторизации данных для использования с vector search.	Yes
deployment_name	string	Указывает название развертывания модели для векторизации. Развертывание этой модели должно осуществляться в том же ресурсе Azure OpenAI, но On Your Data использует эту модель через внутренний вызов, а не публичный, что позволяет векторный поиск даже в частных сетях.	No

onYourDataEndpointVectorizationSource

Детали источника векторизации, используемого Azure OpenAI On Your Data при применении векторного поиска, основанного на публичном запросе Azure OpenAI для вложения.

Name	Type	Description	Required
type	onYourDataVectorizationSourceType	Представляет доступные источники, которые Azure OpenAI On Your Data может использовать для настройки векторизации данных для использования с vector search.	Yes
authentication	onYourDataApiKeyAuthenticationOptions	Опции аутентификации для Azure OpenAI на ваших данных при использовании ключа API.	No
endpoint	string	Указывает конечную точку для векторизации. Эта конечная точка должна находиться в том же ресурсе Azure OpenAI, но On Your Data будет использовать этот конечный вызов через внутренний вызов, а не публичный, что позволяет осуществлять векторный поиск даже в частных сетях.	No

azureChatExtensionsMessageContext

Представление дополнительной контекстной информации, доступной при формировании ответа на завершение чата Azure OpenAI. Эта контекстная информация заполняется только при использовании запроса Azure OpenAI, настроенного на соответствующее расширение.

Name	Type	Description	Required	Default
citations	array	Результат извлечения источника данных используется для генерации ассистентного сообщения в ответе.	No
intent	string	Обнаруженное намерение из истории чата использовалось для передачи на следующий ход и переноса контекста.	No

citation

Информация о цитировании для ответа на завершение чата.

Name	Type	Description	Required
content	string	Содержание цитаты.	Yes
title	string	Название наградного текста.	No
url	string	URL цитаты.	No
filepath	string	Путь к файлу цитирования.	No
chunk_id	string	Идентификатор фрагмента цитаты.	No

chatCompletionMessageToolCall

Name	Type	Description	Required
id	string	ID вызова инструмента.	Yes
type	toolCallType	Тип вызова инструмента, в данном случае `function`.	Yes
function	object	Функция, которую вызывала модель.	Yes

Свойства функции

name

Name	Type	Description	Default
name	string	Название функции для вызова.

arguments

Name	Type	Description	Default
arguments	string	Аргументы для вызова функции, сгенерированные моделью в формате JSON. Обратите внимание, что модель не всегда генерирует валидный JSON и может генерировать параметры, не определённые вашей схемой функций. Проверьте аргументы в коде перед вызовом функции.

toolCallType

Тип вызова инструмента, в данном случае function.

Описание: тип вызова инструмента, в данном случае function.

Type: string

Default:

Имя enum: ToolCallType

Enum Values:

Value	Description
function	Тип вызова инструмента — это функция.

chatCompletionRequestMessageTool

Name	Type	Description	Required	Default
tool_call_id	string	Вызов инструмента, на который отвечает это сообщение.	No
content	string	Содержание сообщения.	No

chatCompletionRequestMessageFunction

Name	Type	Description	Required
role	enum	Роль автора сообщений, в данном `function`случае . Возможные значения: функция	No
name	string	Содержание сообщения.	No
content	string	Содержание сообщения.	No

createChatCompletionResponse

Представляет ответ на завершение чата, возвращаемый моделью на основе предоставленного входа.

Name	Type	Description	Required
id	string	Уникальный идентификатор для завершения чата.	Yes
prompt_filter_results	promptFilterResults	Фильтрация контента приводит к нулю или более запросов в запросе. При стриминговом запросе результаты по разным запросам могут приходить в разное время или в разном порядке.	No
choices	array	Список вариантов завершения чата. Может быть несколько, если `n` больше 1.	Yes
created	integer	Временная метка Unix (в секундах) момента создания чата.	Yes
model	string	Модель, используемая для завершения чата.	Yes
system_fingerprint	string	Этот отпечаток отпечатка отражает конфигурацию бэкенда, с которой работает модель. Может использоваться вместе с параметром `seed` запроса для понимания, когда были внесены изменения в бэкенде, которые могут повлиять на детерминизм.	No
object	enum	Тип объекта, который всегда `chat.completion`равен . Возможные значения: chat.completeion	Yes
usage	completionUsage	Статистика использования для запроса на завершение.	No

createChatCompletionStreamResponse

Представляет собой потоковый фрагмент ответа на завершение чата, возвращаемый моделью на основе предоставленного входа.

Name	Type	Description	Required
id	string	Уникальный идентификатор для завершения чата. Каждый чанк имеет одинаковый идентификатор.	Yes
choices	array	Список вариантов завершения чата. Может содержать более одного элемента, если `n` больше 1.	Yes
created	integer	Временная метка Unix (в секундах) момента создания чата. Каждый чанк имеет одинаковую временную метку.	Yes
model	string	Модель для генерации завершения.	Yes
system_fingerprint	string	Этот отпечаток отпечатка отражает конфигурацию бэкенда, с которой работает модель. Может использоваться вместе с параметром `seed` запроса для понимания, когда были внесены изменения в бэкенде, которые могут повлиять на детерминизм.	No
object	enum	Тип объекта, который всегда `chat.completion.chunk`равен . Возможные значения: chat.completion.chunk	Yes

chatCompletionStreamResponseDelta

Дельта завершения чата, генерируемая потоковыми ответами моделей.

Name	Type	Description	Required
content	string	Содержимое сообщения с чанком.	No
function_call	object	Устаревший и заменённый на `tool_calls`. Имя и аргументы функции, которую следует вызвать, как они генерируются моделью.	No
tool_calls	array		No
role	enum	Роль автора этого сообщения. Возможные значения: система, пользователь, ассистент, инструмент	No
refusal	string	Сообщение об отказе, генерируемое моделью.	No

Свойства для function_call

arguments

Name	Type	Description	Default
arguments	string	Аргументы для вызова функции, сгенерированные моделью в формате JSON. Обратите внимание, что модель не всегда генерирует валидный JSON и может генерировать параметры, не определённые вашей схемой функций. Проверьте аргументы в коде перед вызовом функции.

name

Name	Type	Description	Default
name	string	Название функции для вызова.

chatCompletionMessageToolCallChunk

Name	Type	Description	Required
index	integer		Yes
id	string	ID вызова инструмента.	No
type	enum	Тип инструмента. В настоящее время поддерживается только `function` Only. Возможные значения: функция	No
function	object		No

Свойства функции

name

Name	Type	Description	Default
name	string	Название функции для вызова.

arguments

Name	Type	Description	Default
arguments	string	Аргументы для вызова функции, сгенерированные моделью в формате JSON. Обратите внимание, что модель не всегда генерирует валидный JSON и может генерировать параметры, не определённые вашей схемой функций. Проверьте аргументы в коде перед вызовом функции.

chatCompletionStreamOptions

Варианты для потокового отклика. Устанавливайте это только тогда, когда устанавливаете stream: true.

Name	Type	Description	Required	Default
include_usage	boolean	Если это установлено, перед сообщением будет передаваться `data: [DONE]` дополнительный чанк. `usage` Поле на этом блоке показывает статистику использования токенов для всего запроса, и `choices` поле всегда будет пустым массивом. Все остальные чанки также включают `usage` поле, но с нулевым значением.	No

chatCompletionChoiceLogProbs

Записывайте вероятностную информацию для выбора.

Name	Type	Description	Required	Default
content	array	Список токенов содержимого сообщений с логической вероятностью.	Yes
refusal	array	Список токенов отказа сообщения с логической вероятностной информацией.	No

chatCompletionTokenLogprob

Name	Type	Description	Required
token	string	The token.	Yes
logprob	number	Логарифмическая вероятность этого токена.	Yes
bytes	array	Список целых чисел, представляющих представление токена в байтах UTF-8. Полезно в случаях, когда символы представлены несколькими токенами, и их байтовые представления должны быть комбинированы для создания правильного текстового представления. Возможно, `null` если для токена нет представления байтов.	Yes
top_logprobs	array	Список наиболее вероятных токенов и их логарифмическая вероятность на этой позиции токена. В редких случаях количество возвращённых может быть меньше, чем запрошенное `top_logprobs` возвращение.	Yes

chatCompletionResponseMessage

Сообщение о завершении чата, генерируемое моделью.

Name	Type	Description	Required
role	chatCompletionResponseMessageRole	Роль автора ответного сообщения.	Yes
refusal	string	Сообщение об отказе, генерируемое моделью.	Yes
content	string	Содержание сообщения.	Yes
tool_calls	array	Вызовы инструментов, генерируемые моделью, такие как вызовы функций.	No
function_call	chatCompletionFunctionCall	Устаревший и заменённый на `tool_calls`. Имя и аргументы функции, которую следует вызвать, как они генерируются моделью.	No
context	azureChatExtensionsMessageContext	Представление дополнительной контекстной информации, доступной при использовании расширений чатов Azure OpenAI в генерации соответствующего ответа на завершение чата. Эта контекстная информация заполняется только тогда, когда используя запрос Azure OpenAI, настроенный на использование соответствующего расширения.	No

chatCompletionResponseMessageRole

Роль автора ответного сообщения.

Описание: Роль автора ответного сообщения.

Type: string

Default:

Enum Values:

assistant

chatCompletionToolChoiceOption

Управляет, который (если вообще есть) называется моделью. none это означает, что модель не вызывает никакой инструмент, а вместо этого генерирует сообщение. auto означает, что модель может выбирать между генерацией сообщения и вызовом одного или нескольких инструментов. required значит, модель должна вызывать один или несколько инструментов. Указание конкретного инструмента через {"type": "function", "function": {"name": "my_function"}} заставляет модель вызывать этот инструмент. none является по умолчанию, когда инструменты отсутствуют. auto является по умолчанию, если инструменты присутствуют.

Этот компонент может быть одним из следующих:

chatCompletionNamedToolChoice

Указывает инструмент, который должна использовать модель. Используй, чтобы заставить модель вызывать конкретную функцию.

Name	Type	Description	Required	Default
type	enum	Тип инструмента. В настоящее время поддерживается только `function` Only. Возможные значения: функция	Yes
function	object		Yes

Свойства функции

name

Name	Type	Description	Default
name	string	Название функции для вызова.

ParallelToolCalls

Можно ли включать параллельный вызов функций во время использования инструмента.

Для этого компонента не определённых свойств.

chatCompletionMessageToolCalls

Вызовы инструментов, генерируемые моделью, такие как вызовы функций.

Для этого компонента не определённых свойств.

chatCompletionFunctionCall

Устаревший и заменённый на tool_calls. Имя и аргументы функции, которую следует вызвать, как они генерируются моделью.

Name	Type	Description	Required	Default
name	string	Название функции для вызова.	Yes
arguments	string	Аргументы для вызова функции, сгенерированные моделью в формате JSON. Обратите внимание, что модель не всегда генерирует валидный JSON и может генерировать параметры, не определённые вашей схемой функций. Проверьте аргументы в коде перед вызовом функции.	Yes

completionUsage

Статистика использования для запроса на завершение.

Name	Type	Description	Required
prompt_tokens	integer	Количество токенов в запросе.	Yes
completion_tokens	integer	Количество токенов в сгенерированном завершении.	Yes
total_tokens	integer	Общее количество токенов, использованных в запросе (запрос + завершение).	Yes
completion_tokens_details	object	Разбивка жетонов, использованных при завершении.	No

Свойства для completion_tokens_details

reasoning_tokens

Name	Type	Description	Default
reasoning_tokens	integer	Токены, генерируемые моделью для рассуждения.

chatCompletionTool

Name	Type	Description	Required	Default
type	enum	Тип инструмента. В настоящее время поддерживается только `function` Only. Возможные значения: функция	Yes
function	FunctionObject		Yes

FunctionParameters

Параметры, которые принимают функции, описываются как объект схемы JSON. Смотрите руководство для примеров и справочник JSON Schema для документации по формату.

Опущение parameters определяет функцию с пустым списком параметров.

Для этого компонента не определённых свойств.

FunctionObject

Name	Type	Description	Required	Default
description	string	Описание того, что делает функция, используемое моделью для выбора, когда и как вызывать функцию.	No
name	string	Название функции, которую нужно вызвать. Должны быть a-z, A-Z, 0-9, или содержать подчёркивания и тире, максимальная длина — 64.	Yes
parameters	FunctionParameters	Параметры, которые принимают функции, описываются как объект схемы JSON. Смотрите руководство для примеров и справочник JSON Schema для документации по формату. Опущение `parameters` определяет функцию с пустым списком параметров.	No
strict	boolean	Можно ли включать строгое соблюдение схемы при генерации вызова функции. Если установить true, модель будет следовать точной схеме, `parameters` определённой в поле. Поддерживается только подмножество схемы JSON, когда `strict` .`true`	No	False

ResponseFormatText

Name	Type	Description	Required	Default
type	enum	Тип определяемого формата ответа: `text` Возможные значения: текст	Yes

ResponseFormatJsonObject

Name	Type	Description	Required	Default
type	enum	Тип определяемого формата ответа: `json_object` Возможные значения: json_object	Yes

ResponseFormatJsonSchemaSchema

Схема формата ответа, описываемая как объект схемы JSON.

Для этого компонента не определённых свойств.

ResponseFormatJsonSchema

Name	Type	Description	Required	Default
type	enum	Тип определяемого формата ответа: `json_schema` Возможные значения: json_schema	Yes
json_schema	object		Yes

Свойства для json_schema

description

Name	Type	Description	Default
description	string	Описание того, для чего предназначен формат ответа, используемое моделью для определения того, как отвечать в этом формате.

name

Name	Type	Description	Default
name	string	Название формата ответа. Должны быть a-z, A-Z, 0-9, или содержать подчёркивания и тире, максимальная длина — 64.

schema

Name	Type	Description	Default
schema	ResponseFormatJsonSchemaSchema	Схема формата ответа, описываемая как объект схемы JSON.

strict

Name	Type	Description	Default
strict	boolean	Стоит ли включать строгое соблюдение схемы при генерации вывода. Если установить true, модель всегда будет следовать точной схеме, `schema` определённой в поле. Поддерживается только подмножество схемы JSON, когда `strict` .`true`	False

chatCompletionChoiceCommon

Name	Type	Description	Required	Default
index	integer		No
finish_reason	string		No

createTranslationRequest

Translation request.

Name	Type	Description	Required	Default
file	string	Аудиофайл для перевода.	Yes
prompt	string	Необязательный текст для руководства стилем модели или продолжения предыдущего аудиосегмента. Задание должно быть на английском.	No
response_format	audioResponseFormat	Определяет формат выхода.	No
temperature	number	Температура выборки — от 0 до 1. Более высокие значения, например 0.8, делают выход более случайным, а низкие, например 0.2, делают его более сфокусированным и детерминированным. Если установлено в 0, модель будет использовать логарифмическую вероятность для автоматического повышения температуры до достижения определённых порогов.	No	0

audioResponse

Ответ перевода или транскрипции, когда response_format был json

Name	Type	Description	Required	Default
text	string	Переведённый или расшифрованный текст.	Yes

audioVerboseResponse

Ответ на перевод или транскрипцию, когда response_format был verbose_json

Name	Type	Description	Required
text	string	Переведённый или расшифрованный текст.	Yes
task	string	Тип аудиозадачи.	No
language	string	Language.	No
duration	number	Duration.	No
segments	array		No

audioResponseFormat

Определяет формат выхода.

Описание: Определяет формат выхода.

Type: string

Default:

Enum Values:

json
text
srt
verbose_json
vtt

createTranscriptionRequest

Transcription request.

Name	Type	Description	Required	Default
file	string	Аудиофайл возражает для транскрибации.	Yes
prompt	string	Необязательный текст для руководства стилем модели или продолжения предыдущего аудиосегмента. Запрос должен соответствовать языку аудио.	No
response_format	audioResponseFormat	Определяет формат выхода.	No
temperature	number	Температура выборки — от 0 до 1. Более высокие значения, например 0.8, делают выход более случайным, а низкие, например 0.2, делают его более сфокусированным и детерминированным. Если установлено в 0, модель будет использовать логарифмическую вероятность для автоматического повышения температуры до достижения определённых порогов.	No	0
language	string	Язык входного аудио. Предоставление языка ввода в формате ISO-639-1 повысит точность и задержку.	No

audioSegment

Сегмент транскрипции или перевода.

Name	Type	Description	Required
id	integer	Segment identifier.	No
seek	number	Смещение сегмента.	No
start	number	Смещение старта сегмента.	No
end	number	Смещение конца сегмента.	No
text	string	Segment text.	No
tokens	array	Символы текста.	No
temperature	number	Temperature.	No
avg_logprob	number	Средняя логарифмическая вероятность.	No
compression_ratio	number	Compression ratio.	No
no_speech_prob	number	Вероятность `no speech`.	No

imageQuality

Качество изображения, которое будет создано.

Описание: Качество изображения, которое будет создано.

Type: string

Default: standard

Имя Enum: Качество

Enum Values:

Value	Description
standard	Стандартное качество создаёт изображения со стандартным качеством.
hd	HD-качество создает изображения с более мелкими деталями и большей согласованностью по всему изображению.

imagesResponseFormat

Формат, в котором возвращаются сгенерированные изображения.

Описание: формат, в котором возвращаются сгенерированные изображения.

Type: string

Default: url

Имя enum: ImagesResponseFormat

Enum Values:

Value	Description
url	URL, предоставляющий временный доступ для загрузки сгенерированных изображений.
b64_json	Сгенерированные изображения возвращаются в виде строк, закодированных в базе 64.

imageSize

Размер сгенерированных изображений.

Описание: размер сгенерированных изображений.

Type: string

Default: 1024x1024

Имя энума: размер

Enum Values:

Value	Description
1792x1024	Желаемый размер сгенерированного изображения составляет 1792x1024 пикселя.
1024x1792	Желаемый размер сгенерированного изображения составляет 1024x1792 пикселя.
1024x1024	Желаемый размер сгенерированного изображения составляет 1024x1024 пикселя.

imageStyle

Стиль сгенерированных изображений.

Описание: Стиль сгенерированных изображений.

Type: string

Default: vivid

Имя Энума: Стиль

Enum Values:

Value	Description
vivid	Vivid создаёт гиперреалистичные и драматичные изображения.
natural	Natural создаёт более естественные и менее гиперреалистичные изображения.

imageGenerationsRequest

Name	Type	Description	Required	Default
prompt	string	Текстовое описание желаемого изображения(ов). Максимальная длина — 4 000 символов.	Yes
n	integer	Количество изображений для генерации.	No	1
size	imageSize	Размер сгенерированных изображений.	No	1024x1024
response_format	imagesResponseFormat	Формат, в котором возвращаются сгенерированные изображения.	No	url
user	string	Уникальный идентификатор, представляющий вашего конечного пользователя, который помогает отслеживать и выявлять злоупотребления.	No
quality	imageQuality	Качество изображения, которое будет создано.	No	standard
style	imageStyle	Стиль сгенерированных изображений.	No	vivid

generateImagesResponse

Name	Type	Description	Required	Default
created	integer	Временная метка Unix при создании операции.	Yes
data	array	Результаты операции, если успешны	Yes

imageResult

URL изображения или закодированное изображение, если успешно, а в противном случае — ошибка.

Name	Type	Description	Required
url	string	URL изображения.	No
b64_json	string	Кодируемое изображение base64	No
content_filter_results	dalleContentFilterResults	Информация о результатах фильтрации контента.	No
revised_prompt	string	Подсказка, которая использовалась для создания изображения, если произошла какая-либо коррекция.	No
prompt_filter_results	dalleFilterResults	Информация о категории фильтрации контента (ненависть, сексуальное, насилие self_harm), выявлена ли она, а также уровень тяжести (very_low, низкий, средний, высокий масштаб, определяющий интенсивность и уровень риска вредного контента) и была ли она отфильтрована. Информация о джейлбрейк-контенте и нецензурной лексике, были ли они обнаружены и были ли отфильтрованы или нет. И информация о списке блокировки клиентов, если он был отфильтрован, и его идентификаторе.	No

Completions extensions

Расширения завершений не входят в последнюю GA версию спецификации Azure OpenAI data plane inference.

Chatmessage

Объект сообщения Chat не входит в последнюю GA версию спецификации выведения плоскости данных Azure OpenAI.

Текст в речь (Предварительный просмотр)

В настоящее время не входит в последнюю версию Azure OpenAI GA спецификаци Azure и OpenAI Data Plane inference. Для этой возможности обратитесь к последней версии preview.

Next steps

Узнайте о моделях и тонкой настройке с помощью REST API. Узнайте больше о недоумение моделей, которые Azure OpenAI.

Обратная связь

Были ли сведения на этой странице полезными?

Last updated on 2026-05-06