Azure OpenAI в Microsoft Foundry Models REST API reference (classic)

В настоящее время просмотр:Версия портала Foundry (классическая версия - )Переход на версию для нового портала Foundry

Note

Ссылки в этой статье могут открывать содержимое в новой документации Microsoft Foundry вместо документации по Foundry (классической) сейчас.

В этой статье приведена информация о конечных точках вывода REST API для Azure OpenAI.

API specs

Управление и взаимодействие с моделями и ресурсами Azure OpenAI разделены на три основных поверхности API:

  • Control plane
  • Плоскость данных — авторинг
  • Плоскость данных — вывод

Каждая поверхность/спецификация API инкапсулирует разный набор возможностей Azure OpenAI. Каждый API имеет свой уникальный набор версий предварительного просмотра и стабильных/общедоступных (GA) версий API. В настоящее время превью обычно выходят по ежемесячному ритму.

Important

Теперь появился новый API предпросмотра вывода. Узнайте больше в нашем руководстве по жизненному циклу API.

API Последний превью релиза Последний релиз GA Specifications Description
Control plane 2025-07-01-preview 2025-06-01 Spec files API плоскости управления используется для операций, таких как создание ресурсов, развертывание моделей и другие задачи управления ресурсами высокого уровня. Плоскость управления также регулирует, что можно делать с такими возможностями, как Azure Resource Manager, Bicep, Terraform и Azure CLI.
Data plane v1 preview v1 Spec files API плоскости данных управляет операциями вывода и авторингом.

Authentication

Azure OpenAI предлагает два метода аутентификации. Вы можете использовать либо API Keys, либо Microsoft Entra ID.

  • Аутентификация ключа API: для такого типа аутентификации все запросы API должны содержать ключ API в api-key заголовке HTTP. Quickstart предоставляет рекомендации по совершению звонков с помощью такого типа аутентификации.

  • Microsoft Entra ID аутентификация: Вы можете аутентифицировать вызов API с помощью токена Microsoft Entra. Токены аутентификации включены в запрос в качестве Authorization заголовка. Предоставленный токен должен быть предшествован Bearer, например Bearer YOUR_AUTH_TOKEN, . Вы можете прочитать наше руководство по аутентификации с помощью Microsoft Entra ID.

Версионирование REST API

API сервисов версируются с использованием api-version параметра запроса. Все версии следуют структуре ГГГГMM-DD даты. For example:

POST https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/chat/completions?api-version=2024-06-01

Вывод по плоскости данных

Остальная часть статьи посвящена выпуску GA-спецификации OpenAI для выведения плоскости данных Azure, 2024-10-21.

Если вы ищете документацию по последнему выпуску предварительного просмотра API, обратитесь к последнему API preview data plane inference

Completions

POST https://{endpoint}/openai/deployments/{deployment-id}/completions?api-version=2024-10-21

Создаёт завершение для предоставленного запроса, параметров и выбранной модели.

URI Parameters

Name In Required Type Description
endpoint path Yes string
url
Поддерживается Azure конечных точек OpenAI (протокол и имя хоста, например: https://aoairesource.openai.azure.com. Замените «aoairesource» на имя вашего ресурса Azure OpenAI). https://{your-resource-name}.openai.azure.com
deployment-id path Yes string ID развертывания модели, которая была развернута.
api-version query Yes string API version

Request Header

Name Required Type Description
api-key True string Предоставьте ключ API Azure OpenAI здесь

Request Body

Content-Type: application/json

Name Type Description Required Default
prompt строка или массив Запрос(ы) для генерации завершений, закодированных как строка, массив строк, массив токенов или массив токенов.

Обратите внимание, что <|endoftext|> — это разделитель документов, который модель видит во время обучения, поэтому если запрос не указан, модель генерируется как из начала нового документа.
Yes
best_of integer Генерирует best_of завершения на сервере и возвращает «лучшее» (то, с наибольшей логичной вероятностью на токен). Результаты нельзя транслировать.

При использовании с n, best_of управляет количеством кандидатных завершений и n указывает, сколько возвращать â€" best_of должно быть больше .n

Примечание: Поскольку этот параметр генерирует множество завершений, он может быстро поглотить вашу квоту токенов. Используйте внимательно и убедитесь, что у вас есть разумные настройки для max_tokens и stop.
No 1
echo boolean Эхо подскажите заданию в дополнение к завершению
No False
frequency_penalty number Число от -2,0 до 2,0. Положительные значения наказывают новые токены в зависимости от их существующей частоты в тексте, снижая вероятность повторения одной и той же строки дословно.
No 0
logit_bias object Измените вероятность появления указанных токенов в завершении.

Принимает JSON-объект, который сопоставляет токены (указанные их идентификатором токена в GPT-токенайзере) с соответствующим значением смещения от -100 до 100. Математически смещение добавляется к логитам, генерируемым моделью до выборки. Точный эффект будет различаться в зависимости от модели, но значения между -1 и 1 должны снижать или увеличивать вероятность отбора; Значения вроде -100 или 100 должны привести к бану или эксклюзивному выбору соответствующего токена.

Например, вы можете попасть {"50256": -100} так, чтобы предотвратить генерацию <токена |endoftext|>
No None
logprobs integer Включите логические вероятности для logprobs наиболее вероятных выходных токенов, а также выбранные токены. Например, если logprobs равен 5, API вернёт список из пяти наиболее вероятных токенов. API всегда вернёт logprob сэмплированный токен, поэтому в ответе могут быть элементы logprobs+1 до предела.

Максимальное значение для logprobs — 5.
No None
max_tokens integer Максимальное количество токенов, которые могут быть сгенерированы при завершении.

Количество токенов в вашем prompt plus max_tokens не должно превышать длину контекста модели.
No 16
n integer Сколько завершений нужно создавать для каждого запроса.

Примечание: Поскольку этот параметр генерирует множество завершений, он может быстро поглотить вашу квоту токенов. Используйте внимательно и убедитесь, что у вас есть разумные настройки для max_tokens и stop.
No 1
presence_penalty number Число от -2,0 до 2,0. Положительные значения наказывают новые токены в зависимости от того, появляются ли они в тексте на данный момент, увеличивая вероятность обсуждения новых тем.
No 0
seed integer Если указано, наша система приложит максимум усилий для выборки детерминированно, чтобы повторяющиеся запросы с одинаковыми seed параметрами возвращали тот же результат.

Детерминизм не гарантирован, и вам следует обращаться к system_fingerprint параметру отклика для отслеживания изменений в бэкенде.
No
stop строка или массив До четырёх последовательностей, в которых API перестанет генерировать новые токены. Возвращаемый текст не будет содержать последовательность остановки.
No
stream boolean Стоит ли возвращаться к частичному прогрессу. Если это установлено, токены будут отправляться в виде событий , отправляемых только на сервер данных, по мере их появления, а поток завершается data: [DONE] сообщением. No False
suffix string Суффикс, который появляется после завершения вставленного текста.

Этот параметр поддерживается только для gpt-3.5-turbo-instruct.
No None
temperature number Какую температуру использовать — от 0 до 2. Более высокие значения, например 0.8, делают выход более случайным, а низкие, например 0.2, делают его более сфокусированным и детерминированным.

Обычно мы рекомендуем менять это или top_p не делать и то, и другое.
No 1
top_p number Альтернатива выборке с температурой, называемая ядреной выборкой, при которой модель учитывает результаты токенов с top_p вероятностной массой. Таким образом, 0.1 означает, что учитываются только токены, составляющие топ-10% массу вероятности.

Обычно мы рекомендуем менять это или temperature не делать и то, и другое.
No 1
user string Уникальный идентификатор, представляющий вашего конечного пользователя, который помогает отслеживать и выявлять злоупотребления.
No

Responses

Код статуса: 200

Description: OK

Content-Type Type Description
application/json createCompletionResponse Представляет ответ на завершение от API. Примечание: потоковые и непотоковые объекты ответов имеют одну и ту же форму (в отличие от чат-эндпоинта).

Код статуса: по умолчанию

Описание: Услуга недоступна

Content-Type Type Description
application/json errorResponse

Examples

Example

Создаёт завершение для предоставленного запроса, параметров и выбранной модели.

POST https://{endpoint}/openai/deployments/{deployment-id}/completions?api-version=2024-10-21

{
 "prompt": [
  "tell me a joke about mango"
 ],
 "max_tokens": 32,
 "temperature": 1.0,
 "n": 1
}

Ответы: Код статуса: 200

{
  "body": {
    "id": "cmpl-7QmVI15qgYVllxK0FtxVGG6ywfzaq",
    "created": 1686617332,
    "choices": [
      {
        "text": "es\n\nWhat do you call a mango who's in charge?\n\nThe head mango.",
        "index": 0,
        "finish_reason": "stop",
        "logprobs": null
      }
    ],
    "usage": {
      "completion_tokens": 20,
      "prompt_tokens": 6,
      "total_tokens": 26
    }
  }
}

Embeddings

POST https://{endpoint}/openai/deployments/{deployment-id}/embeddings?api-version=2024-10-21

Получите векторное представление заданного входа, которое легко воспринимается моделями и алгоритмами машинного обучения.

URI Parameters

Name In Required Type Description
endpoint path Yes string
url
Поддерживается Azure конечных точек OpenAI (протокол и имя хоста, например: https://aoairesource.openai.azure.com. Замените «aoairesource» на имя вашего ресурса Azure OpenAI). https://{your-resource-name}.openai.azure.com
deployment-id path Yes string
api-version query Yes string API version

Request Header

Name Required Type Description
api-key True string Предоставьте ключ API Azure OpenAI здесь

Request Body

Content-Type: application/json

Name Type Description Required Default
input строка или массив Вводите текст для вложения, закодированный в виде строки или массива токенов. Чтобы встроить несколько входных данных в один запрос, передайте массив строк или массив токенов. Входные данные не должны превышать максимальные входные токены для модели (8 192 токена для text-embedding-ada-002), не может быть пустой строкой, и любой массив должен иметь размерность 2 048 или меньше. Yes
user string Уникальный идентификатор, представляющий вашего конечного пользователя, который помогает отслеживать и выявлять злоупотребления. No
input_type string Тип ввода для поиска вложения для использования No
encoding_format string Формат для возврата встраиваний. Может быть и то, float и другое, либо base64. По умолчанию — .float No
dimensions integer Количество размеров, которые должны иметь полученные вложения. Поддерживается только в text-embedding-3 и более поздних моделях. No

Responses

Name Type Description Required Default
object string Yes
model string Yes
data array Yes
usage object Yes

Свойства для использования

prompt_tokens

Name Type Description Default
prompt_tokens integer

total_tokens

Name Type Description Default
total_tokens integer

Код статуса: 200

Description: OK

Content-Type Type Description
application/json object

Examples

Example

Верните вложения для заданного запроса.

POST https://{endpoint}/openai/deployments/{deployment-id}/embeddings?api-version=2024-10-21

{
 "input": [
  "this is a test"
 ]
}

Ответы: Код статуса: 200

{
  "body": {
    "data": [
      {
        "index": 0,
        "embedding": [
          -0.012838088,
          -0.007421397,
          -0.017617522,
          -0.028278312,
          -0.018666342,
          0.01737855,
          -0.01821495,
          -0.006950092,
          -0.009937238,
          -0.038580645,
          0.010674067,
          0.02412286,
          -0.013647936,
          0.013189907,
          0.0021125758,
          0.012406612,
          0.020790534,
          0.00074595667,
          0.008397198,
          -0.00535031,
          0.008968075,
          0.014351576,
          -0.014086051,
          0.015055214,
          -0.022211088,
          -0.025198232,
          0.0065186154,
          -0.036350243,
          0.009180495,
          -0.009698266,
          0.009446018,
          -0.008463579,
          -0.0040426035,
          -0.03443847,
          -0.00091273896,
          -0.0019217303,
          0.002349888,
          -0.021560553,
          0.016515596,
          -0.015572986,
          0.0038666942,
          -8.432463e-05
        ]
      }
    ],
    "usage": {
      "prompt_tokens": 4,
      "total_tokens": 4
    }
  }
}

Chat completions

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2024-10-21

Создаёт завершение сообщения в чате

URI Parameters

Name In Required Type Description
endpoint path Yes string
url
Поддерживается Azure конечных точек OpenAI (протокол и имя хоста, например: https://aoairesource.openai.azure.com. Замените «aoairesource» на имя вашего ресурса Azure OpenAI). https://{your-resource-name}.openai.azure.com
deployment-id path Yes string ID развертывания модели, которая была развернута.
api-version query Yes string API version

Request Header

Name Required Type Description
api-key True string Предоставьте ключ API Azure OpenAI здесь

Request Body

Content-Type: application/json

Name Type Description Required Default
temperature number Какую температуру использовать — от 0 до 2. Более высокие значения, например 0.8, делают выход более случайным, а низкие, например 0.2, делают его более сфокусированным и детерминированным.

Обычно мы рекомендуем менять это или top_p не делать и то, и другое.
No 1
top_p number Альтернатива выборке с температурой, называемая ядреной выборкой, при которой модель учитывает результаты токенов с top_p вероятностной массой. Таким образом, 0.1 означает, что учитываются только токены, составляющие топ-10% массу вероятности.

Обычно мы рекомендуем менять это или temperature не делать и то, и другое.
No 1
stream boolean Если установлено, будут отправляться частичные дельты сообщений, как в ChatGPT. Токены будут отправляться в виде событий , отправляемых только на сервер данных, по мере их появления, при этом поток завершается data: [DONE] сообщением. No False
stop строка или массив До четырёх последовательностей, в которых API перестанет генерировать новые токены.
No
max_tokens integer Максимальное количество токенов, которые можно сгенерировать в ходе завершения чата.

Общая длина входных и генерируемых токенов ограничена длиной контекста модели.
No
max_completion_tokens integer Верхняя граница количества токенов, которые могут быть сгенерированы для завершения, включая видимые выходные токены и токены рассуждения. No
presence_penalty number Число от -2,0 до 2,0. Положительные значения наказывают новые токены в зависимости от того, появляются ли они в тексте на данный момент, увеличивая вероятность обсуждения новых тем.
No 0
frequency_penalty number Число от -2,0 до 2,0. Положительные значения наказывают новые токены в зависимости от их существующей частоты в тексте, снижая вероятность повторения одной и той же строки дословно.
No 0
logit_bias object Измените вероятность появления указанных токенов в завершении.

Принимает JSON-объект, который отображает токены (указанные их идентификатором токена в токенайзере) с соответствующим значением смещения от -100 до 100. Математически смещение добавляется к логитам, генерируемым моделью до выборки. Точный эффект будет различаться в зависимости от модели, но значения между -1 и 1 должны снижать или увеличивать вероятность отбора; Значения вроде -100 или 100 должны привести к бану или эксклюзивному выбору соответствующего токена.
No None
user string Уникальный идентификатор, представляющий вашего конечного пользователя, который помогает отслеживать и выявлять злоупотребления.
No
messages array Список сообщений, составляющих разговор на данный момент. Yes
data_sources array Конфигурационные записи для чат-расширений Azure OpenAI, которые их используют.
Эта дополнительная спецификация совместима только с Azure OpenAI.
No
logprobs boolean Вопрос о том, нужно ли возвращать логические вероятности выходных токенов или нет. Если верно, возвращает логарифмические вероятности каждого выходного токена, возвращаемого в content .message No False
top_logprobs integer Целое число от 0 до 20, указывающее число наиболее вероятных токенов для возврата на каждой позиции токена, каждый с соответствующей логарифмической вероятностью. logprobs должно быть установлено как true , если используется этот параметр. No
n integer Сколько вариантов завершения чата нужно генерировать для каждого вводного сообщения? Обратите внимание, что с вас будет взиматься плата в зависимости от количества сгенерированных токенов во всех вариантах. Держитесь n , чтобы 1 минимизировать расходы. No 1
parallel_tool_calls ParallelToolCalls Можно ли включать параллельный вызов функций во время использования инструмента. No True
response_format ResponseFormatText или ResponseFormatJsonObject или ResponseFormatJsonSchema Объект, указывающий формат, который модель должна вывести. Совместим с GPT-4o, GPT-4o mini, GPT-4 Turbo и всеми моделями GPT-3.5 Turbo новее gpt-3.5-turbo-1106.

Настройка включает { "type": "json_schema", "json_schema": {...} } структурированные выходы, что гарантирует, что модель будет совпадать с вашей JSON-схемой.

Установка включает { "type": "json_object" } режим JSON, который гарантирует, что сообщение, которое генерирует модель, является действительным JSON.

Важно: при использовании режима JSON вы также должны инструктировать модель создавать JSON самостоятельно через систему или пользовательское сообщение. Без этого модель может генерировать бесконечный поток пустых пробелов до тех пор, пока генерация не достигнет лимита токенов, что приводит к длительному и, казалось бы, «застрявшему» запросу. Также обратите внимание, что содержимое сообщения может быть частично обрезано, если finish_reason="length", что означает, что генерация превысила max_tokens или разговор превысил максимальную длину контекста.
No
seed integer Эта функция находится в бета-версии.
Если указано, наша система приложит максимум усилий для выборки детерминированно, чтобы повторяющиеся запросы с одинаковыми seed параметрами возвращали тот же результат.
Детерминизм не гарантирован, и вам следует обращаться к system_fingerprint параметру отклика для отслеживания изменений в бэкенде.
No
tools array Список инструментов, которые может вызывать модель. В настоящее время поддерживаются только функции как инструменты. Используйте это, чтобы предоставить список функций, для которых модель может генерировать JSON-входы. Поддерживается максимум 128 функций.
No
tool_choice chatCompletionToolChoiceOption Управляет, который (если вообще есть) называется моделью. none это означает, что модель не вызывает никакой инструмент, а вместо этого генерирует сообщение. auto означает, что модель может выбирать между генерацией сообщения и вызовом одного или нескольких инструментов. required значит, модель должна вызывать один или несколько инструментов. Указание конкретного инструмента через {"type": "function", "function": {"name": "my_function"}} заставляет модель вызывать этот инструмент. none является по умолчанию, когда инструменты отсутствуют. auto является по умолчанию, если инструменты присутствуют. No
function_call строка или chatCompletionFunctionCallOption Устаревший в пользу tool_choice.

Управляет, функция которой (если таковая есть) вызывается моделью.
none означает, что модель не вызывает функцию, а вместо этого генерирует сообщение.
auto означает, что модель может выбирать между генерированием сообщения и вызовом функции.
Определение определённой функции через {"name": "my_function"} заставляет модель вызывать эту функцию.

none является по умолчанию, когда функции отсутствуют. auto является по умолчанию, если функции присутствуют.
No
functions array Устаревший в пользу tools.

Список функций, для которых модель может генерировать JSON-входы.
No

Responses

Код статуса: 200

Description: OK

Content-Type Type Description
application/json createChatCompletionResponse или createChatCompletionStreamResponse

Код статуса: по умолчанию

Описание: Услуга недоступна

Content-Type Type Description
application/json errorResponse

Examples

Example

Создаёт завершение для предоставленного запроса, параметров и выбранной модели.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2024-10-21

{
 "messages": [
  {
   "role": "system",
   "content": "you are a helpful assistant that talks like a pirate"
  },
  {
   "role": "user",
   "content": "can you tell me how to care for a parrot?"
  }
 ]
}

Ответы: Код статуса: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Ahoy matey! So ye be wantin' to care for a fine squawkin' parrot, eh? Well, shiver me timbers, let ol' Cap'n Assistant share some wisdom with ye! Here be the steps to keepin' yer parrot happy 'n healthy:\n\n1. Secure a sturdy cage: Yer parrot be needin' a comfortable place to lay anchor! Be sure ye get a sturdy cage, at least double the size of the bird's wingspan, with enough space to spread their wings, yarrrr!\n\n2. Perches 'n toys: Aye, parrots need perches of different sizes, shapes, 'n textures to keep their feet healthy. Also, a few toys be helpin' to keep them entertained 'n their minds stimulated, arrrh!\n\n3. Proper grub: Feed yer feathered friend a balanced diet of high-quality pellets, fruits, 'n veggies to keep 'em strong 'n healthy. Give 'em fresh water every day, or ye\u00e2\u20ac\u2122ll have a scurvy bird on yer hands!\n\n4. Cleanliness: Swab their cage deck! Clean their cage on a regular basis: fresh water 'n food daily, the floor every couple of days, 'n a thorough scrubbing ev'ry few weeks, so the bird be livin' in a tidy haven, arrhh!\n\n5. Socialize 'n train: Parrots be a sociable lot, arrr! Exercise 'n interact with 'em daily to create a bond 'n maintain their mental 'n physical health. Train 'em with positive reinforcement, treat 'em kindly, yarrr!\n\n6. Proper rest: Yer parrot be needin' \u00e2\u20ac\u2122bout 10-12 hours o' sleep each night. Cover their cage 'n let them slumber in a dim, quiet quarter for a proper night's rest, ye scallywag!\n\n7. Keep a weather eye open for illness: Birds be hidin' their ailments, arrr! Be watchful for signs of sickness, such as lethargy, loss of appetite, puffin' up, or change in droppings, and make haste to a vet if need be.\n\n8. Provide fresh air 'n avoid toxins: Parrots be sensitive to draft and pollutants. Keep yer quarters well ventilated, but no drafts, arrr! Be mindful of toxins like Teflon fumes, candles, or air fresheners.\n\nSo there ye have it, me hearty! With proper care 'n commitment, yer parrot will be squawkin' \"Yo-ho-ho\" for many years to come! Good luck, sailor, and may the wind be at yer back!"
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Example

Создаёт завершение на основе данных Azure Search и управляемой идентичности, назначенной системой.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2024-10-21

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a dog?"
  }
 ],
 "data_sources": [
  {
   "type": "azure_search",
   "parameters": {
    "endpoint": "https://your-search-endpoint.search.windows.net/",
    "index_name": "{index name}",
    "authentication": {
     "type": "system_assigned_managed_identity"
    }
   }
  }
 ]
}

Ответы: Код статуса: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion [doc1].",
          "context": {
            "citations": [
              {
                "content": "Citation content.",
                "title": "Citation Title",
                "filepath": "contoso.txt",
                "url": "https://contoso.blob.windows.net/container/contoso.txt",
                "chunk_id": "0"
              }
            ],
            "intent": "dog care"
          }
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Example

Создаёт завершение на основе данных вектора поиска Azure, предыдущего сообщения ассистента и управляемой личности, назначенной пользователем.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2024-10-21

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a cat?"
  },
  {
   "role": "assistant",
   "content": "Content of the completion [doc1].",
   "context": {
    "intent": "cat care"
   }
  },
  {
   "role": "user",
   "content": "how about dog?"
  }
 ],
 "data_sources": [
  {
   "type": "azure_search",
   "parameters": {
    "endpoint": "https://your-search-endpoint.search.windows.net/",
    "authentication": {
     "type": "user_assigned_managed_identity",
     "managed_identity_resource_id": "/subscriptions/{subscription-id}/resourceGroups/{resource-group}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{resource-name}"
    },
    "index_name": "{index name}",
    "query_type": "vector",
    "embedding_dependency": {
     "type": "deployment_name",
     "deployment_name": "{embedding deployment name}"
    },
    "in_scope": true,
    "top_n_documents": 5,
    "strictness": 3,
    "role_information": "You are an AI assistant that helps people find information.",
    "fields_mapping": {
     "content_fields_separator": "\\n",
     "content_fields": [
      "content"
     ],
     "filepath_field": "filepath",
     "title_field": "title",
     "url_field": "url",
     "vector_fields": [
      "contentvector"
     ]
    }
   }
  }
 ]
}

Ответы: Код статуса: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion [doc1].",
          "context": {
            "citations": [
              {
                "content": "Citation content 2.",
                "title": "Citation Title 2",
                "filepath": "contoso2.txt",
                "url": "https://contoso.blob.windows.net/container/contoso2.txt",
                "chunk_id": "0"
              }
            ],
            "intent": "dog care"
          }
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Example

Создаёт завершение для предоставленной Azure Cosmos DB.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2024-10-21

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a dog?"
  }
 ],
 "data_sources": [
  {
   "type": "azure_cosmos_db",
   "parameters": {
    "authentication": {
     "type": "connection_string",
     "connection_string": "mongodb+srv://rawantest:{password}$@{cluster-name}.mongocluster.cosmos.azure.com/?tls=true&authMechanism=SCRAM-SHA-256&retrywrites=false&maxIdleTimeMS=120000"
    },
    "database_name": "vectordb",
    "container_name": "azuredocs",
    "index_name": "azuredocindex",
    "embedding_dependency": {
     "type": "deployment_name",
     "deployment_name": "{embedding deployment name}"
    },
    "fields_mapping": {
     "content_fields": [
      "content"
     ],
     "vector_fields": [
      "contentvector"
     ]
    }
   }
  }
 ]
}

Ответы: Код статуса: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion [doc1].",
          "context": {
            "citations": [
              {
                "content": "Citation content.",
                "title": "Citation Title",
                "filepath": "contoso.txt",
                "url": "https://contoso.blob.windows.net/container/contoso.txt",
                "chunk_id": "0"
              }
            ],
            "intent": "dog care"
          }
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Транскрипции — Создайте

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2024-10-21

Транскрибирует аудио на язык входа.

URI Parameters

Name In Required Type Description
endpoint path Yes string
url
Поддерживается Azure конечных точек OpenAI (протокол и имя хоста, например: https://aoairesource.openai.azure.com. Замените «aoairesource» на имя вашего ресурса Azure OpenAI). https://{your-resource-name}.openai.azure.com
deployment-id path Yes string ID развертывания модели речи в текст.

Для информации о поддерживаемых моделях см. [/azure/ai-foundry/openai/concepts/models#audio-models].
api-version query Yes string API version

Request Header

Name Required Type Description
api-key True string Предоставьте ключ API Azure OpenAI здесь

Request Body

Content-Type: multipart/form-data

Name Type Description Required Default
file string Аудиофайл возражает для транскрибации. Yes
prompt string Необязательный текст для руководства стилем модели или продолжения предыдущего аудиосегмента. Запрос должен соответствовать языку аудио. No
response_format audioResponseFormat Определяет формат выхода. No
temperature number Температура выборки — от 0 до 1. Более высокие значения, например 0.8, делают выход более случайным, а низкие, например 0.2, делают его более сфокусированным и детерминированным. Если установлено в 0, модель будет использовать логарифмическую вероятность для автоматического повышения температуры до достижения определённых порогов. No 0
language string Язык входного аудио. Предоставление языка ввода в формате ISO-639-1 повысит точность и задержку. No

Responses

Код статуса: 200

Description: OK

Content-Type Type Description
application/json audioResponse или audioVerboseResponse
text/plain string Транскрибированный текст в выходном формате (когда response_format был текстом, vtt или srt).

Examples

Example

Получает транскрибированный текст и связанные метаданные из предоставленных аудиоданных.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2024-10-21

Ответы: Код статуса: 200

{
  "body": {
    "text": "A structured object when requesting json or verbose_json"
  }
}

Example

Получает транскрибированный текст и связанные метаданные из предоставленных аудиоданных.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2024-10-21

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

Ответы: Код статуса: 200

{
  "type": "string",
  "example": "plain text when requesting text, srt, or vtt"
}

Переводы - Create

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2024-10-21

Транскрибирует и переводит входные аудиозаписи на английский текст.

URI Parameters

Name In Required Type Description
endpoint path Yes string
url
Поддерживается Azure конечных точек OpenAI (протокол и имя хоста, например: https://aoairesource.openai.azure.com. Замените «aoairesource» на имя вашего ресурса Azure OpenAI). https://{your-resource-name}.openai.azure.com
deployment-id path Yes string ID развертывания модели шепота, которая была развернута.

Для информации о поддерживаемых моделях см. [/azure/ai-foundry/openai/concepts/models#audio-models].
api-version query Yes string API version

Request Header

Name Required Type Description
api-key True string Предоставьте ключ API Azure OpenAI здесь

Request Body

Content-Type: multipart/form-data

Name Type Description Required Default
file string Аудиофайл для перевода. Yes
prompt string Необязательный текст для руководства стилем модели или продолжения предыдущего аудиосегмента. Задание должно быть на английском. No
response_format audioResponseFormat Определяет формат выхода. No
temperature number Температура выборки — от 0 до 1. Более высокие значения, например 0.8, делают выход более случайным, а низкие, например 0.2, делают его более сфокусированным и детерминированным. Если установлено в 0, модель будет использовать логарифмическую вероятность для автоматического повышения температуры до достижения определённых порогов. No 0

Responses

Код статуса: 200

Description: OK

Content-Type Type Description
application/json audioResponse или audioVerboseResponse
text/plain string Транскрибированный текст в выходном формате (когда response_format был текстом, vtt или srt).

Examples

Example

Получает транскрибированный текст на английском языке и связанные с ним метаданные из предоставленных аудиоданных.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2024-10-21

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

Ответы: Код статуса: 200

{
  "body": {
    "text": "A structured object when requesting json or verbose_json"
  }
}

Example

Получает транскрибированный текст на английском языке и связанные с ним метаданные из предоставленных аудиоданных.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2024-10-21

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

Ответы: Код статуса: 200

{
  "type": "string",
  "example": "plain text when requesting text, srt, or vtt"
}

Image generation

POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2024-10-21

Генерирует набор изображений из текстовой подписи при заданном развертывании модели dall-e

URI Parameters

Name In Required Type Description
endpoint path Yes string
url
Поддерживается Azure конечных точек OpenAI (протокол и имя хоста, например: https://aoairesource.openai.azure.com. Замените «aoairesource» на имя вашего ресурса Azure OpenAI). https://{your-resource-name}.openai.azure.com
deployment-id path Yes string ID развертывания модели dall-e, которая была развернута.
api-version query Yes string API version

Request Header

Name Required Type Description
api-key True string Предоставьте ключ API Azure OpenAI здесь

Request Body

Content-Type: application/json

Name Type Description Required Default
prompt string Текстовое описание желаемого изображения(ов). Максимальная длина — 4 000 символов. Yes
n integer Количество изображений для генерации. No 1
size imageSize Размер сгенерированных изображений. No 1024x1024
response_format imagesResponseFormat Формат, в котором возвращаются сгенерированные изображения. No url
user string Уникальный идентификатор, представляющий вашего конечного пользователя, который помогает отслеживать и выявлять злоупотребления. No
quality imageQuality Качество изображения, которое будет создано. No standard
style imageStyle Стиль сгенерированных изображений. No vivid

Responses

Код статуса: 200

Description: Ok

Content-Type Type Description
application/json generateImagesResponse

Код статуса: по умолчанию

Описание: произошла ошибка.

Content-Type Type Description
application/json dalleErrorResponse

Examples

Example

Создаёт изображения по заданию.

POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2024-10-21

{
 "prompt": "In the style of WordArt, Microsoft Clippy wearing a cowboy hat.",
 "n": 1,
 "style": "natural",
 "quality": "standard"
}

Ответы: Код статуса: 200

{
  "body": {
    "created": 1698342300,
    "data": [
      {
        "revised_prompt": "A vivid, natural representation of Microsoft Clippy wearing a cowboy hat.",
        "prompt_filter_results": {
          "sexual": {
            "severity": "safe",
            "filtered": false
          },
          "violence": {
            "severity": "safe",
            "filtered": false
          },
          "hate": {
            "severity": "safe",
            "filtered": false
          },
          "self_harm": {
            "severity": "safe",
            "filtered": false
          },
          "profanity": {
            "detected": false,
            "filtered": false
          }
        },
        "url": "https://dalletipusw2.blob.core.windows.net/private/images/e5451cc6-b1ad-4747-bd46-b89a3a3b8bc3/generated_00.png?se=2023-10-27T17%3A45%3A09Z&...",
        "content_filter_results": {
          "sexual": {
            "severity": "safe",
            "filtered": false
          },
          "violence": {
            "severity": "safe",
            "filtered": false
          },
          "hate": {
            "severity": "safe",
            "filtered": false
          },
          "self_harm": {
            "severity": "safe",
            "filtered": false
          }
        }
      }
    ]
  }
}

Components

errorResponse

Name Type Description Required Default
error error No

errorBase

Name Type Description Required Default
code string No
message string No

error

Name Type Description Required Default
param string No
type string No
inner_error innerError Внутренняя ошибка с дополнительными деталями. No

innerError

Внутренняя ошибка с дополнительными деталями.

Name Type Description Required Default
code innerErrorCode Коды ошибок для внутреннего объекта ошибки. No
content_filter_results contentFilterPromptResults Информация о категории фильтрации контента (ненависть, сексуальное, насилие self_harm), выявлена ли она, а также уровень тяжести (very_low, низкий, средний, высокий масштаб, определяющий интенсивность и уровень риска вредного контента) и была ли она отфильтрована. Информация о джейлбрейк-контенте и нецензурной лексике, были ли они обнаружены и были ли отфильтрованы или нет. И информация о списке блокировки клиентов, если он был отфильтрован, и его идентификаторе. No

innerErrorCode

Коды ошибок для внутреннего объекта ошибки.

Описание: коды ошибок для объекта внутренних ошибок.

Type: string

Default:

Имя enum: InnerErrorCode

Enum Values:

Value Description
ResponsibleAIPolicyViolation Запрос нарушал одно из правил фильтрации контента.

dalleErrorResponse

Name Type Description Required Default
error dalleError No

dalleError

Name Type Description Required Default
param string No
type string No
inner_error dalleInnerError Внутренняя ошибка с дополнительными деталями. No

dalleInnerError

Внутренняя ошибка с дополнительными деталями.

Name Type Description Required Default
code innerErrorCode Коды ошибок для внутреннего объекта ошибки. No
content_filter_results dalleFilterResults Информация о категории фильтрации контента (ненависть, сексуальное, насилие self_harm), выявлена ли она, а также уровень тяжести (very_low, низкий, средний, высокий масштаб, определяющий интенсивность и уровень риска вредного контента) и была ли она отфильтрована. Информация о джейлбрейк-контенте и нецензурной лексике, были ли они обнаружены и были ли отфильтрованы или нет. И информация о списке блокировки клиентов, если он был отфильтрован, и его идентификаторе. No
revised_prompt string Подсказка, которая использовалась для создания изображения, если произошла какая-либо коррекция. No

contentFilterResultBase

Name Type Description Required Default
filtered boolean Yes

contentFilterSeverityResult

Name Type Description Required Default
filtered boolean Yes
severity string No

contentFilterDetectedResult

Name Type Description Required Default
filtered boolean Yes
detected boolean No

contentFilterDetectedWithCitationResult

Name Type Description Required Default
citation object No

Свойства цитирования

URL

Name Type Description Default
URL string

license

Name Type Description Default
license string

contentFilterResultsBase

Информация о результатах фильтрации контента.

Name Type Description Required Default
sexual contentFilterSeverityResult No
violence contentFilterSeverityResult No
hate contentFilterSeverityResult No
self_harm contentFilterSeverityResult No
profanity contentFilterDetectedResult No
error errorBase No

contentFilterPromptResults

Информация о категории фильтрации контента (ненависть, сексуальное, насилие self_harm), выявлена ли она, а также уровень тяжести (very_low, низкий, средний, высокий масштаб, определяющий интенсивность и уровень риска вредного контента) и была ли она отфильтрована. Информация о джейлбрейк-контенте и нецензурной лексике, были ли они обнаружены и были ли отфильтрованы или нет. И информация о списке блокировки клиентов, если он был отфильтрован, и его идентификаторе.

Name Type Description Required Default
sexual contentFilterSeverityResult No
violence contentFilterSeverityResult No
hate contentFilterSeverityResult No
self_harm contentFilterSeverityResult No
profanity contentFilterDetectedResult No
error errorBase No
jailbreak contentFilterDetectedResult No

contentFilterChoiceResults

Информация о категории фильтрации контента (ненависть, сексуальное, насилие self_harm), выявлена ли она, а также уровень тяжести (very_low, низкий, средний, высокий масштаб, определяющий интенсивность и уровень риска вредного контента) и была ли она отфильтрована. Информация о стороннем тексте и нецензурной лексике, обнаружена ли она и была ли отфильтрована или нет. И информация о списке блокировки клиентов, если он был отфильтрован, и его идентификаторе.

Name Type Description Required Default
sexual contentFilterSeverityResult No
violence contentFilterSeverityResult No
hate contentFilterSeverityResult No
self_harm contentFilterSeverityResult No
profanity contentFilterDetectedResult No
error errorBase No
protected_material_text contentFilterDetectedResult No
protected_material_code contentFilterDetectedWithCitationResult No

promptFilterResult

Фильтрация контента по одному запросу в запросе.

Name Type Description Required Default
prompt_index integer No
content_filter_results contentFilterPromptResults Информация о категории фильтрации контента (ненависть, сексуальное, насилие self_harm), выявлена ли она, а также уровень тяжести (very_low, низкий, средний, высокий масштаб, определяющий интенсивность и уровень риска вредного контента) и была ли она отфильтрована. Информация о джейлбрейк-контенте и нецензурной лексике, были ли они обнаружены и были ли отфильтрованы или нет. И информация о списке блокировки клиентов, если он был отфильтрован, и его идентификаторе. No

promptFilterResults

Фильтрация контента приводит к нулю или более запросов в запросе. При стриминговом запросе результаты по разным запросам могут приходить в разное время или в разном порядке.

Для этого компонента не определённых свойств.

dalleContentFilterResults

Информация о результатах фильтрации контента.

Name Type Description Required Default
sexual contentFilterSeverityResult No
violence contentFilterSeverityResult No
hate contentFilterSeverityResult No
self_harm contentFilterSeverityResult No

dalleFilterResults

Информация о категории фильтрации контента (ненависть, сексуальное, насилие self_harm), выявлена ли она, а также уровень тяжести (very_low, низкий, средний, высокий масштаб, определяющий интенсивность и уровень риска вредного контента) и была ли она отфильтрована. Информация о джейлбрейк-контенте и нецензурной лексике, были ли они обнаружены и были ли отфильтрованы или нет. И информация о списке блокировки клиентов, если он был отфильтрован, и его идентификаторе.

Name Type Description Required Default
sexual contentFilterSeverityResult No
violence contentFilterSeverityResult No
hate contentFilterSeverityResult No
self_harm contentFilterSeverityResult No
profanity contentFilterDetectedResult No
jailbreak contentFilterDetectedResult No

chatCompletionsRequestCommon

Name Type Description Required Default
temperature number Какую температуру использовать — от 0 до 2. Более высокие значения, например 0.8, делают выход более случайным, а низкие, например 0.2, делают его более сфокусированным и детерминированным.
Обычно мы рекомендуем менять это или top_p не делать и то, и другое.
No 1
top_p number Альтернатива выборке с температурой, называемая ядреной выборкой, при которой модель учитывает результаты токенов с top_p вероятностной массой. Таким образом, 0.1 означает, что учитываются только токены, составляющие топ-10% массу вероятности.
Обычно мы рекомендуем менять это или temperature не делать и то, и другое.
No 1
stream boolean Если установлено, будут отправляться частичные дельты сообщений, как в ChatGPT. Токены будут отправляться в виде событий, отправляемых только на сервер данных, по мере их появления, при этом поток завершается data: [DONE] сообщением. No False
stop строка или массив До четырёх последовательностей, в которых API перестанет генерировать новые токены. No
max_tokens integer Максимальное количество токенов, разрешённое для сгенерированного ответа. По умолчанию количество токенов, которые модель может вернуть, будет (4096 — токены запросов). Сейчас это значение устарело в max_completion_tokensпользу , и не совместимо с моделями серии O1. No 4096
max_completion_tokens integer Верхняя граница количества токенов, которые могут быть сгенерированы для завершения, включая видимые выходные токены и токены рассуждения. No
presence_penalty number Число от -2,0 до 2,0. Положительные значения наказывают новые токены в зависимости от того, появляются ли они в тексте на данный момент, увеличивая вероятность обсуждения новых тем. No 0
frequency_penalty number Число от -2,0 до 2,0. Положительные значения наказывают новые токены в зависимости от их существующей частоты в тексте, снижая вероятность повторения одной и той же строки дословно. No 0
logit_bias object Измените вероятность появления указанных токенов в завершении. Принимает объект json, который сопоставляет токены (указанные их идентификатором токена в токенайзере) с соответствующим значением смещения от -100 до 100. Математически смещение добавляется к логитам, генерируемым моделью до выборки. Точный эффект будет различаться в зависимости от модели, но значения между -1 и 1 должны снижать или увеличивать вероятность отбора; Значения вроде -100 или 100 должны привести к бану или эксклюзивному выбору соответствующего токена. No
user string Уникальный идентификатор, представляющий вашего конечного пользователя, который помогает Azure OpenAI отслеживать и выявлять злоупотребления. No

createCompletionRequest

Name Type Description Required Default
prompt строка или массив Запрос(ы) для генерации завершений, закодированных как строка, массив строк, массив токенов или массив токенов.

Обратите внимание, что <|endoftext|> — это разделитель документов, который модель видит во время обучения, поэтому если запрос не указан, модель генерируется как из начала нового документа.
Yes
best_of integer Генерирует best_of завершения на сервере и возвращает «лучшее» (то, с наибольшей логичной вероятностью на токен). Результаты нельзя транслировать.

При использовании с n, best_of управляет количеством кандидатных завершений и n указывает, сколько возвращать â€" best_of должно быть больше .n

Примечание: Поскольку этот параметр генерирует множество завершений, он может быстро поглотить вашу квоту токенов. Используйте внимательно и убедитесь, что у вас есть разумные настройки для max_tokens и stop.
No 1
echo boolean Эхо подскажите заданию в дополнение к завершению
No False
frequency_penalty number Число от -2,0 до 2,0. Положительные значения наказывают новые токены в зависимости от их существующей частоты в тексте, снижая вероятность повторения одной и той же строки дословно.
No 0
logit_bias object Измените вероятность появления указанных токенов в завершении.

Принимает JSON-объект, который сопоставляет токены (указанные их идентификатором токена в GPT-токенайзере) с соответствующим значением смещения от -100 до 100. Математически смещение добавляется к логитам, генерируемым моделью до выборки. Точный эффект будет различаться в зависимости от модели, но значения между -1 и 1 должны снижать или увеличивать вероятность отбора; Значения вроде -100 или 100 должны привести к бану или эксклюзивному выбору соответствующего токена.

Например, вы можете попасть {"50256": -100} так, чтобы предотвратить генерацию <токена |endoftext|>
No None
logprobs integer Включите логические вероятности для logprobs наиболее вероятных выходных токенов, а также выбранные токены. Например, если logprobs равен 5, API вернёт список из пяти наиболее вероятных токенов. API всегда вернёт logprob сэмплированный токен, поэтому в ответе могут быть элементы logprobs+1 до предела.

Максимальное значение для logprobs — 5.
No None
max_tokens integer Максимальное количество токенов, которые могут быть сгенерированы при завершении.

Количество токенов в вашем prompt plus max_tokens не должно превышать длину контекста модели.
No 16
n integer Сколько завершений нужно создавать для каждого запроса.

Примечание: Поскольку этот параметр генерирует множество завершений, он может быстро поглотить вашу квоту токенов. Используйте внимательно и убедитесь, что у вас есть разумные настройки для max_tokens и stop.
No 1
presence_penalty number Число от -2,0 до 2,0. Положительные значения наказывают новые токены в зависимости от того, появляются ли они в тексте на данный момент, увеличивая вероятность обсуждения новых тем.
No 0
seed integer Если указано, наша система приложит максимум усилий для выборки детерминированно, чтобы повторяющиеся запросы с одинаковыми seed параметрами возвращали тот же результат.

Детерминизм не гарантирован, и вам следует обращаться к system_fingerprint параметру отклика для отслеживания изменений в бэкенде.
No
stop строка или массив До четырёх последовательностей, в которых API перестанет генерировать новые токены. Возвращаемый текст не будет содержать последовательность остановки.
No
stream boolean Стоит ли возвращаться к частичному прогрессу. Если это установлено, токены будут отправляться в виде событий , отправляемых только на сервер данных, по мере их появления, а поток завершается data: [DONE] сообщением. No False
suffix string Суффикс, который появляется после завершения вставленного текста.

Этот параметр поддерживается только для gpt-3.5-turbo-instruct.
No None
temperature number Какую температуру использовать — от 0 до 2. Более высокие значения, например 0.8, делают выход более случайным, а низкие, например 0.2, делают его более сфокусированным и детерминированным.

Обычно мы рекомендуем менять это или top_p не делать и то, и другое.
No 1
top_p number Альтернатива выборке с температурой, называемая ядреной выборкой, при которой модель учитывает результаты токенов с top_p вероятностной массой. Таким образом, 0.1 означает, что учитываются только токены, составляющие топ-10% массу вероятности.

Обычно мы рекомендуем менять это или temperature не делать и то, и другое.
No 1
user string Уникальный идентификатор, представляющий вашего конечного пользователя, который помогает отслеживать и выявлять злоупотребления.
No

createCompletionResponse

Представляет ответ на завершение от API. Примечание: потоковые и непотоковые объекты ответов имеют одну и ту же форму (в отличие от чат-эндпоинта).

Name Type Description Required Default
id string Уникальный идентификатор для завершения. Yes
choices array Список вариантов завершения, который модель генерировала для входного запроса. Yes
created integer Временная метка Unix (в секундах) момента создания завершения. Yes
model string Модель, использованная для завершения. Yes
prompt_filter_results promptFilterResults Фильтрация контента приводит к нулю или более запросов в запросе. При стриминговом запросе результаты по разным запросам могут приходить в разное время или в разном порядке. No
system_fingerprint string Этот отпечаток отпечатка отражает конфигурацию бэкенда, с которой работает модель.

Может использоваться вместе с параметром seed запроса для понимания, когда были внесены изменения в бэкенде, которые могут повлиять на детерминизм.
No
object enum Тип объекта, который всегда «text_completion»
Возможные значения: text_completion
Yes
usage completionUsage Статистика использования для запроса на завершение. No

createChatCompletionRequest

Name Type Description Required Default
temperature number Какую температуру использовать — от 0 до 2. Более высокие значения, например 0.8, делают выход более случайным, а низкие, например 0.2, делают его более сфокусированным и детерминированным.

Обычно мы рекомендуем менять это или top_p не делать и то, и другое.
No 1
top_p number Альтернатива выборке с температурой, называемая ядреной выборкой, при которой модель учитывает результаты токенов с top_p вероятностной массой. Таким образом, 0.1 означает, что учитываются только токены, составляющие топ-10% массу вероятности.

Обычно мы рекомендуем менять это или temperature не делать и то, и другое.
No 1
stream boolean Если установлено, будут отправляться частичные дельты сообщений, как в ChatGPT. Токены будут отправляться в виде событий , отправляемых только на сервер данных, по мере их появления, при этом поток завершается data: [DONE] сообщением. No False
stop строка или массив До четырёх последовательностей, в которых API перестанет генерировать новые токены.
No
max_tokens integer Максимальное количество токенов, которые можно сгенерировать в ходе завершения чата.

Общая длина входных и генерируемых токенов ограничена длиной контекста модели.
No
max_completion_tokens integer Верхняя граница количества токенов, которые могут быть сгенерированы для завершения, включая видимые выходные токены и токены рассуждения. No
presence_penalty number Число от -2,0 до 2,0. Положительные значения наказывают новые токены в зависимости от того, появляются ли они в тексте на данный момент, увеличивая вероятность обсуждения новых тем.
No 0
frequency_penalty number Число от -2,0 до 2,0. Положительные значения наказывают новые токены в зависимости от их существующей частоты в тексте, снижая вероятность повторения одной и той же строки дословно.
No 0
logit_bias object Измените вероятность появления указанных токенов в завершении.

Принимает JSON-объект, который отображает токены (указанные их идентификатором токена в токенайзере) с соответствующим значением смещения от -100 до 100. Математически смещение добавляется к логитам, генерируемым моделью до выборки. Точный эффект будет различаться в зависимости от модели, но значения между -1 и 1 должны снижать или увеличивать вероятность отбора; Значения вроде -100 или 100 должны привести к бану или эксклюзивному выбору соответствующего токена.
No None
user string Уникальный идентификатор, представляющий вашего конечного пользователя, который помогает отслеживать и выявлять злоупотребления.
No
messages array Список сообщений, составляющих разговор на данный момент. Yes
data_sources array Конфигурационные записи для чат-расширений Azure OpenAI, которые их используют.
Эта дополнительная спецификация совместима только с Azure OpenAI.
No
logprobs boolean Вопрос о том, нужно ли возвращать логические вероятности выходных токенов или нет. Если верно, возвращает логарифмические вероятности каждого выходного токена, возвращаемого в content .message No False
top_logprobs integer Целое число от 0 до 20, указывающее число наиболее вероятных токенов для возврата на каждой позиции токена, каждый с соответствующей логарифмической вероятностью. logprobs должно быть установлено как true , если используется этот параметр. No
n integer Сколько вариантов завершения чата нужно генерировать для каждого вводного сообщения? Обратите внимание, что с вас будет взиматься плата в зависимости от количества сгенерированных токенов во всех вариантах. Держитесь n , чтобы 1 минимизировать расходы. No 1
parallel_tool_calls ParallelToolCalls Можно ли включать параллельный вызов функций во время использования инструмента. No True
response_format ResponseFormatText или ResponseFormatJsonObject или ResponseFormatJsonSchema Объект, указывающий формат, который модель должна вывести. Совместим с GPT-4o, GPT-4o mini, GPT-4 Turbo и всеми моделями GPT-3.5 Turbo новее gpt-3.5-turbo-1106.

Настройка включает { "type": "json_schema", "json_schema": {...} } структурированные выходы, что гарантирует, что модель будет совпадать с вашей JSON-схемой.

Установка включает { "type": "json_object" } режим JSON, который гарантирует, что сообщение, которое генерирует модель, является действительным JSON.

Важно: при использовании режима JSON вы также должны инструктировать модель создавать JSON самостоятельно через систему или пользовательское сообщение. Без этого модель может генерировать бесконечный поток пустых пробелов до тех пор, пока генерация не достигнет лимита токенов, что приводит к длительному и, казалось бы, «застрявшему» запросу. Также обратите внимание, что содержимое сообщения может быть частично обрезано, если finish_reason="length", что означает, что генерация превысила max_tokens или разговор превысил максимальную длину контекста.
No
seed integer Эта функция находится в бета-версии.
Если указано, наша система приложит максимум усилий для выборки детерминированно, чтобы повторяющиеся запросы с одинаковыми seed параметрами возвращали тот же результат.
Детерминизм не гарантирован, и вам следует обращаться к system_fingerprint параметру отклика для отслеживания изменений в бэкенде.
No
tools array Список инструментов, которые может вызывать модель. В настоящее время поддерживаются только функции как инструменты. Используйте это, чтобы предоставить список функций, для которых модель может генерировать JSON-входы. Поддерживается максимум 128 функций.
No
tool_choice chatCompletionToolChoiceOption Управляет, который (если вообще есть) называется моделью. none это означает, что модель не вызывает никакой инструмент, а вместо этого генерирует сообщение. auto означает, что модель может выбирать между генерацией сообщения и вызовом одного или нескольких инструментов. required значит, модель должна вызывать один или несколько инструментов. Указание конкретного инструмента через {"type": "function", "function": {"name": "my_function"}} заставляет модель вызывать этот инструмент. none является по умолчанию, когда инструменты отсутствуют. auto является по умолчанию, если инструменты присутствуют. No
function_call строка или chatCompletionFunctionCallOption Устаревший в пользу tool_choice.

Управляет, функция которой (если таковая есть) вызывается моделью.
none означает, что модель не вызывает функцию, а вместо этого генерирует сообщение.
auto означает, что модель может выбирать между генерированием сообщения и вызовом функции.
Определение определённой функции через {"name": "my_function"} заставляет модель вызывать эту функцию.

none является по умолчанию, когда функции отсутствуют. auto является по умолчанию, если функции присутствуют.
No
functions array Устаревший в пользу tools.

Список функций, для которых модель может генерировать JSON-входы.
No

chatCompletionFunctions

Name Type Description Required Default
description string Описание того, что делает функция, используемое моделью для выбора, когда и как вызывать функцию. No
name string Название функции, которую нужно вызвать. Должны быть a-z, A-Z, 0-9, или содержать подчёркивания и тире, максимальная длина — 64. Yes
parameters FunctionParameters Параметры, которые принимают функции, описываются как объект схемы JSON. Смотрите руководство для примеров и справочник JSON Schema для документации по формату.

Опущение parameters определяет функцию с пустым списком параметров.
No

chatCompletionFunctionCallOption

Определение определённой функции через {"name": "my_function"} заставляет модель вызывать эту функцию.

Name Type Description Required Default
name string Название функции для вызова. Yes

chatCompletionRequestMessage

Этот компонент может быть одним из следующих:

chatCompletionRequestSystemMessage

Name Type Description Required Default
content строка или массив Содержимое системного сообщения. Yes
role enum Роль автора сообщений, в данном systemслучае .
Возможные значения: система
Yes
name string Необязательное имя для участника. Предоставляет информацию о модели для различия участников одной и той же роли. No

chatCompletionRequestUserMessage

Name Type Description Required Default
content строка или массив Содержимое пользовательского сообщения.
Yes
role enum Роль автора сообщений, в данном userслучае .
Возможные значения: пользователь
Yes
name string Необязательное имя для участника. Предоставляет информацию о модели для различия участников одной и той же роли. No

chatCompletionRequestAssistantMessage

Name Type Description Required Default
content строка или массив Содержимое сообщения от помощника. Обязательно, если только tool_calls не указано или function_call не указано.
No
refusal string Сообщение об отказе от ассистента. No
role enum Роль автора сообщений, в данном assistantслучае .
Возможные значения: ассистент
Yes
name string Необязательное имя для участника. Предоставляет информацию о модели для различия участников одной и той же роли. No
tool_calls chatCompletionMessageToolCalls Вызовы инструментов, генерируемые моделью, такие как вызовы функций. No
function_call object Устаревший и заменённый на tool_calls. Имя и аргументы функции, которую следует вызвать, как они генерируются моделью. No

Свойства для function_call

arguments

Name Type Description Default
arguments string Аргументы для вызова функции, сгенерированные моделью в формате JSON. Обратите внимание, что модель не всегда генерирует валидный JSON и может генерировать параметры, не определённые вашей схемой функций. Проверьте аргументы в коде перед вызовом функции.

name

Name Type Description Default
name string Название функции для вызова.

chatCompletionRequestToolMessage

Name Type Description Required Default
role enum Роль автора сообщений, в данном toolслучае .
Возможные значения: инструмент
Yes
content строка или массив Содержимое сообщения инструмента. Yes
tool_call_id string Вызов инструмента, на который отвечает это сообщение. Yes

chatCompletionRequestFunctionMessage

Name Type Description Required Default
role enum Роль автора сообщений, в данном functionслучае .
Возможные значения: функция
Yes
content string Содержимое сообщения функции. Yes
name string Название функции для вызова. Yes

chatCompletionRequestSystemMessageContentPart

Этот компонент может быть одним из следующих:

chatCompletionRequestUserMessageContentPart

Этот компонент может быть одним из следующих:

chatCompletionRequestAssistantMessageContentPart

Этот компонент может быть одним из следующих:

chatCompletionRequestToolMessageContentPart

Этот компонент может быть одним из следующих:

chatCompletionRequestMessageContentPartText

Name Type Description Required Default
type enum Тип контента.
Возможные значения: текст
Yes
text string Содержание текста. Yes

chatCompletionRequestMessageContentPartImage

Name Type Description Required Default
type enum Тип контента.
Возможные значения: image_url
Yes
image_url object Yes

Свойства для image_url

url

Name Type Description Default
url string Либо URL изображения, либо данные изображения, закодированные в base64.

detail

Name Type Description Default
detail string Указывает уровень детализации изображения. Узнайте больше в руководстве Vision. auto

chatCompletionRequestMessageContentPartRefusal

Name Type Description Required Default
type enum Тип контента.
Возможные значения: отказ
Yes
refusal string Сообщение об отказе, генерируемое моделью. Yes

azureChatExtensionConfiguration

Представление конфигурационных данных для одного расширения чата Azure OpenAI. Это будет использоваться для запроса на завершение чата, который должен использовать расширения чата Azure OpenAI для усиления поведения ответа. Использование этой конфигурации совместимо только с Azure OpenAI.

Name Type Description Required Default
type azureChatExtensionType Представление конфигурационных данных для одного расширения чата Azure OpenAI. Это будет использоваться в чате
Запрос на завершение, которые должны использовать расширения чата Azure OpenAI для усиления поведения ответа.
Использование этой конфигурации совместимо только с Azure OpenAI.
Yes

azureChatExtensionType

Представление конфигурационных данных для одного расширения чата Azure OpenAI. Это будет использоваться для запроса на завершение чата, который должен использовать расширения чата Azure OpenAI для усиления поведения ответа. Использование этой конфигурации совместимо только с Azure OpenAI.

Описание: Представление конфигурационных данных для одного расширения чата Azure OpenAI. Это будет использоваться для запроса на завершение чата, который должен использовать расширения чата Azure OpenAI для усиления поведения ответа. Использование этой конфигурации совместимо только с Azure OpenAI.

Type: string

Default:

Enum Name: AzureChatExtensionType

Enum Values:

Value Description
azure_search Представляет использование Azure Search как расширения чата Azure OpenAI.
azure_cosmos_db Представляет использование Azure Cosmos DB в качестве расширения для чата Azure OpenAI.

azureSearchChatExtensionConfiguration

Конкретное представление настраиваемых опций для Azure Search при использовании его в качестве расширения чата Azure OpenAI.

Name Type Description Required Default
type azureChatExtensionType Представление конфигурационных данных для одного расширения чата Azure OpenAI. Это будет использоваться в чате
Запрос на завершение, которые должны использовать расширения чата Azure OpenAI для усиления поведения ответа.
Использование этой конфигурации совместимо только с Azure OpenAI.
Yes
parameters azureSearchChatExtensionParameters Параметры для Azure Search при использовании в качестве расширения чата Azure OpenAI. No

azureSearchChatExtensionParameters

Параметры для Azure Search при использовании в качестве расширения чата Azure OpenAI.

Name Type Description Required Default
authentication onYourDataApiKeyAuthenticationOptions или onYourDataSystemAssignedManagedIdentityAuthenticationOptions или onYourDataUserAssignedManagedIdentityAuthenticationOptions или onYourDataUserAssignedManagedIdentityAuthenticationOptions. Yes
top_n_documents integer Настроенное максимальное количество документов для настроенного запроса. No
in_scope boolean Следует ли ограничивать запросы использованием индексированных данных. No
strictness integer Настроенная строгость фильтрации релевантности поиска. Чем выше строгость, тем выше точность, но меньше запоминания ответа. No
role_information string Дайте модели инструкции о том, как она должна вести себя и какой контекст должна ссылаться при генерации ответа. Вы можете описать характер ассистента и объяснить, как правильно оформлять ответы. Для него есть лимит в 100 токенов, и он засчитывается к общему лимиту токенов. No
endpoint string Абсолютный путь конечной точки, который может использовать ресурс Azure Search. Yes
index_name string Название индекса для использования, как оно доступно в упомянутом ресурсе Azure Search. Yes
fields_mapping azureSearchIndexFieldMappingOptions Опциональные настройки для управления обработкой полей при использовании настроенного ресурса поиска Azure. No
query_type azureSearchQueryType Тип поискового запроса в Azure Search, который должен выполняться при использовании его в качестве расширения чата Azure OpenAI. No
semantic_configuration string Дополнительная семантическая конфигурация запроса. No
filter string Search filter. No
embedding_dependency onYourDataEndpointVectorizationSource или onYourDataDeploymentNameVectorizationSource No

azureSearchIndexFieldMappingOptions

Опциональные настройки для управления обработкой полей при использовании настроенного ресурса поиска Azure.

Name Type Description Required Default
title_field string Название индексного поля для заголовка. No
url_field string Название индексного поля для использования в качестве URL. No
filepath_field string Название индексного поля для использования в качестве пути к файлу. No
content_fields array Имена индексных полей, которые должны рассматриваться как содержимое. No
content_fields_separator string Шаблон разделителя, который должны использовать поля содержания. No
vector_fields array Названия полей, представляющих векторные данные. No

azureSearchQueryType

Тип поискового запроса в Azure Search, который должен выполняться при использовании его в качестве расширения чата Azure OpenAI.

Description: тип поискового запроса Azure Search, который должен выполняться при использовании в качестве расширения чата Azure OpenAI.

Type: string

Default:

Enum Name: AzureSearchQueryType

Enum Values:

Value Description
simple Представляет собой простой парсер запросов по умолчанию.
semantic Представляет парсер семантических запросов для расширенного семантического моделирования.
vector Представляет векторный поиск по вычисленным данным.
vector_simple_hybrid Представляет собой сочетание простой стратегии запроса с векторными данными.
vector_semantic_hybrid Представляет собой сочетание семантического поиска и векторных запросов по данным.

azureCosmosDBChatExtensionConfiguration

Специфическое представление конфигурируемых опций для Azure Cosmos DB при использовании её в качестве расширения чата Azure OpenAI.

Name Type Description Required Default
type azureChatExtensionType Представление конфигурационных данных для одного расширения чата Azure OpenAI. Это будет использоваться в чате
Запрос на завершение, которые должны использовать расширения чата Azure OpenAI для усиления поведения ответа.
Использование этой конфигурации совместимо только с Azure OpenAI.
Yes
parameters azureCosmosDBChatExtensionParameters Параметры для использования при конфигурировании Azure OpenAI On Your Data chat extensions при использовании Azure Cosmos DB для
MongoDB vCore.
No

azureCosmosDBChatExtensionParameters

Параметры для использования при конфигурировании Azure OpenAI на расширениях чата Your Data при использовании Azure Cosmos DB for MongoDB vCore.

Name Type Description Required Default
authentication onYourDataConnectionStringAuthenticationOptions Опции аутентификации для Azure OpenAI On Your Data при использовании строка подключения. Yes
top_n_documents integer Настроенное максимальное количество документов для настроенного запроса. No
in_scope boolean Следует ли ограничивать запросы использованием индексированных данных. No
strictness integer Настроенная строгость фильтрации релевантности поиска. Чем выше строгость, тем выше точность, но меньше запоминания ответа. No
role_information string Дайте модели инструкции о том, как она должна вести себя и какой контекст должна ссылаться при генерации ответа. Вы можете описать характер ассистента и объяснить, как правильно оформлять ответы. Для него есть лимит в 100 токенов, и он засчитывается к общему лимиту токенов. No
database_name string Имя базы данных MongoDB vCore для использования с Azure Cosmos DB. Yes
container_name string Название контейнера ресурсов Azure Cosmos DB. Yes
index_name string Имя индекса MongoDB vCore для использования с Azure Cosmos DB. Yes
fields_mapping azureCosmosDBFieldMappingOptions Опциональные настройки для управления обработкой полей при использовании настроенного ресурса Azure Cosmos DB. Yes
embedding_dependency onYourDataEndpointVectorizationSource или onYourDataDeploymentNameVectorizationSource Yes

azureCosmosDBFieldMappingOptions

Опциональные настройки для управления обработкой полей при использовании настроенного ресурса Azure Cosmos DB.

Name Type Description Required Default
title_field string Название индексного поля для заголовка. No
url_field string Название индексного поля для использования в качестве URL. No
filepath_field string Название индексного поля для использования в качестве пути к файлу. No
content_fields array Имена индексных полей, которые должны рассматриваться как содержимое. Yes
content_fields_separator string Шаблон разделителя, который должны использовать поля содержания. No
vector_fields array Названия полей, представляющих векторные данные. Yes

onYourDataAuthenticationOptions

Опции аутентификации для Azure OpenAI на ваших данных.

Name Type Description Required Default
type onYourDataAuthenticationType Типы аутентификации, поддерживаемые Azure OpenAI на ваших данных. Yes

onYourDataAuthenticationType

Типы аутентификации, поддерживаемые Azure OpenAI на ваших данных.

Описание: Типы аутентификации, поддерживаемые Azure OpenAI On Your Data.

Type: string

Default:

Имя enum: OnYourDataAuthenticationType

Enum Values:

Value Description
api_key Аутентификация с помощью API-ключа.
connection_string Аутентификация через строка подключения.
system_assigned_managed_identity Аутентификация с помощью управляемой идентификации, назначенной системой.
user_assigned_managed_identity Аутентификация с помощью управляемой личности, назначенной пользователем.

onYourDataApiKeyAuthenticationOptions

Опции аутентификации для Azure OpenAI на ваших данных при использовании ключа API.

Name Type Description Required Default
type onYourDataAuthenticationType Типы аутентификации, поддерживаемые Azure OpenAI на ваших данных. Yes
key string Ключ API для аутентификации. No

onYourDataConnectionStringAuthenticationOptions

Опции аутентификации для Azure OpenAI On Your Data при использовании строка подключения.

Name Type Description Required Default
type onYourDataAuthenticationType Типы аутентификации, поддерживаемые Azure OpenAI на ваших данных. Yes
connection_string string Это строка подключения для аутентификации. No

onYourDataSystemAssignedManagedIdentityAuthenticationOptions

Опции аутентификации для Azure OpenAI на ваших данных при использовании управляемой идентичности, назначенной системой.

Name Type Description Required Default
type onYourDataAuthenticationType Типы аутентификации, поддерживаемые Azure OpenAI на ваших данных. Yes

onYourDataUserAssignedManagedIdentityAuthenticationOptions

Опции аутентификации для Azure OpenAI на ваших данных при использовании управляемой личности, назначенной пользователем.

Name Type Description Required Default
type onYourDataAuthenticationType Типы аутентификации, поддерживаемые Azure OpenAI на ваших данных. Yes
managed_identity_resource_id string Идентификатор ресурса управляемой личности, назначенной пользователем для аутентификации. No

onYourDataVectorizationSource

Абстрактное представление источника векторизации для Azure OpenAI On Your Data с векторным поиском.

Name Type Description Required Default
type onYourDataVectorizationSourceType Представляет доступные источники, которые Azure OpenAI On Your Data может использовать для настройки векторизации данных для использования с
vector search.
Yes

onYourDataVectorizationSourceType

Представляет доступные источники, которые Azure OpenAI On Your Data может использовать для настройки векторизации данных для использования с векторным поиском.

Description: Представляет доступные источники, Azure OpenAI On Your Data может использовать для настройки векторизации данных для использования с
vector search.

Type: string

Default:

Имя enum: OnYourDataVectorizationSourceType

Enum Values:

Value Description
endpoint Представляет векторизацию, выполняемую вызовами публичных сервисов в модель вложения Azure OpenAI.
deployment_name Представляет имя развертывания модели Ada для использования. Развертывание этой модели должно быть в том же ресурсе Azure OpenAI, но
On Your Data будет использовать эту модель для развертывания через внутренний вызов, а не публичный, что позволяет использовать вектор
Ищите даже в частных сетях.

onYourDataDeploymentNameVectorizationSource

Детали источника векторизации, используемого Azure OpenAI On Your Data при применении векторного поиска, основанного на внутреннем имени модели развертывания в том же ресурсе Azure OpenAI.

Name Type Description Required Default
type onYourDataVectorizationSourceType Представляет доступные источники, которые Azure OpenAI On Your Data может использовать для настройки векторизации данных для использования с
vector search.
Yes
deployment_name string Указывает название развертывания модели для векторизации. Развертывание этой модели должно осуществляться в том же ресурсе Azure OpenAI, но On Your Data использует эту модель через внутренний вызов, а не публичный, что позволяет векторный поиск даже в частных сетях. No

onYourDataEndpointVectorizationSource

Детали источника векторизации, используемого Azure OpenAI On Your Data при применении векторного поиска, основанного на публичном запросе Azure OpenAI для вложения.

Name Type Description Required Default
type onYourDataVectorizationSourceType Представляет доступные источники, которые Azure OpenAI On Your Data может использовать для настройки векторизации данных для использования с
vector search.
Yes
authentication onYourDataApiKeyAuthenticationOptions Опции аутентификации для Azure OpenAI на ваших данных при использовании ключа API. No
endpoint string Указывает конечную точку для векторизации. Эта конечная точка должна находиться в том же ресурсе Azure OpenAI, но On Your Data будет использовать этот конечный вызов через внутренний вызов, а не публичный, что позволяет осуществлять векторный поиск даже в частных сетях. No

azureChatExtensionsMessageContext

Представление дополнительной контекстной информации, доступной при формировании ответа на завершение чата Azure OpenAI. Эта контекстная информация заполняется только при использовании запроса Azure OpenAI, настроенного на соответствующее расширение.

Name Type Description Required Default
citations array Результат извлечения источника данных используется для генерации ассистентного сообщения в ответе. No
intent string Обнаруженное намерение из истории чата использовалось для передачи на следующий ход и переноса контекста. No

citation

Информация о цитировании для ответа на завершение чата.

Name Type Description Required Default
content string Содержание цитаты. Yes
title string Название наградного текста. No
url string URL цитаты. No
filepath string Путь к файлу цитирования. No
chunk_id string Идентификатор фрагмента цитаты. No

chatCompletionMessageToolCall

Name Type Description Required Default
id string ID вызова инструмента. Yes
type toolCallType Тип вызова инструмента, в данном случае function. Yes
function object Функция, которую вызывала модель. Yes

Свойства функции

name

Name Type Description Default
name string Название функции для вызова.

arguments

Name Type Description Default
arguments string Аргументы для вызова функции, сгенерированные моделью в формате JSON. Обратите внимание, что модель не всегда генерирует валидный JSON и может генерировать параметры, не определённые вашей схемой функций. Проверьте аргументы в коде перед вызовом функции.

toolCallType

Тип вызова инструмента, в данном случае function.

Описание: тип вызова инструмента, в данном случае function.

Type: string

Default:

Имя enum: ToolCallType

Enum Values:

Value Description
function Тип вызова инструмента — это функция.

chatCompletionRequestMessageTool

Name Type Description Required Default
tool_call_id string Вызов инструмента, на который отвечает это сообщение. No
content string Содержание сообщения. No

chatCompletionRequestMessageFunction

Name Type Description Required Default
role enum Роль автора сообщений, в данном functionслучае .
Возможные значения: функция
No
name string Содержание сообщения. No
content string Содержание сообщения. No

createChatCompletionResponse

Представляет ответ на завершение чата, возвращаемый моделью на основе предоставленного входа.

Name Type Description Required Default
id string Уникальный идентификатор для завершения чата. Yes
prompt_filter_results promptFilterResults Фильтрация контента приводит к нулю или более запросов в запросе. При стриминговом запросе результаты по разным запросам могут приходить в разное время или в разном порядке. No
choices array Список вариантов завершения чата. Может быть несколько, если n больше 1. Yes
created integer Временная метка Unix (в секундах) момента создания чата. Yes
model string Модель, используемая для завершения чата. Yes
system_fingerprint string Этот отпечаток отпечатка отражает конфигурацию бэкенда, с которой работает модель.

Может использоваться вместе с параметром seed запроса для понимания, когда были внесены изменения в бэкенде, которые могут повлиять на детерминизм.
No
object enum Тип объекта, который всегда chat.completionравен .
Возможные значения: chat.completeion
Yes
usage completionUsage Статистика использования для запроса на завершение. No

createChatCompletionStreamResponse

Представляет собой потоковый фрагмент ответа на завершение чата, возвращаемый моделью на основе предоставленного входа.

Name Type Description Required Default
id string Уникальный идентификатор для завершения чата. Каждый чанк имеет одинаковый идентификатор. Yes
choices array Список вариантов завершения чата. Может содержать более одного элемента, если n больше 1.
Yes
created integer Временная метка Unix (в секундах) момента создания чата. Каждый чанк имеет одинаковую временную метку. Yes
model string Модель для генерации завершения. Yes
system_fingerprint string Этот отпечаток отпечатка отражает конфигурацию бэкенда, с которой работает модель.
Может использоваться вместе с параметром seed запроса для понимания, когда были внесены изменения в бэкенде, которые могут повлиять на детерминизм.
No
object enum Тип объекта, который всегда chat.completion.chunkравен .
Возможные значения: chat.completion.chunk
Yes

chatCompletionStreamResponseDelta

Дельта завершения чата, генерируемая потоковыми ответами моделей.

Name Type Description Required Default
content string Содержимое сообщения с чанком. No
function_call object Устаревший и заменённый на tool_calls. Имя и аргументы функции, которую следует вызвать, как они генерируются моделью. No
tool_calls array No
role enum Роль автора этого сообщения.
Возможные значения: система, пользователь, ассистент, инструмент
No
refusal string Сообщение об отказе, генерируемое моделью. No

Свойства для function_call

arguments

Name Type Description Default
arguments string Аргументы для вызова функции, сгенерированные моделью в формате JSON. Обратите внимание, что модель не всегда генерирует валидный JSON и может генерировать параметры, не определённые вашей схемой функций. Проверьте аргументы в коде перед вызовом функции.

name

Name Type Description Default
name string Название функции для вызова.

chatCompletionMessageToolCallChunk

Name Type Description Required Default
index integer Yes
id string ID вызова инструмента. No
type enum Тип инструмента. В настоящее время поддерживается только function Only.
Возможные значения: функция
No
function object No

Свойства функции

name

Name Type Description Default
name string Название функции для вызова.

arguments

Name Type Description Default
arguments string Аргументы для вызова функции, сгенерированные моделью в формате JSON. Обратите внимание, что модель не всегда генерирует валидный JSON и может генерировать параметры, не определённые вашей схемой функций. Проверьте аргументы в коде перед вызовом функции.

chatCompletionStreamOptions

Варианты для потокового отклика. Устанавливайте это только тогда, когда устанавливаете stream: true.

Name Type Description Required Default
include_usage boolean Если это установлено, перед сообщением будет передаваться data: [DONE] дополнительный чанк. usage Поле на этом блоке показывает статистику использования токенов для всего запроса, и choices поле всегда будет пустым массивом. Все остальные чанки также включают usage поле, но с нулевым значением.
No

chatCompletionChoiceLogProbs

Записывайте вероятностную информацию для выбора.

Name Type Description Required Default
content array Список токенов содержимого сообщений с логической вероятностью. Yes
refusal array Список токенов отказа сообщения с логической вероятностной информацией. No

chatCompletionTokenLogprob

Name Type Description Required Default
token string The token. Yes
logprob number Логарифмическая вероятность этого токена. Yes
bytes array Список целых чисел, представляющих представление токена в байтах UTF-8. Полезно в случаях, когда символы представлены несколькими токенами, и их байтовые представления должны быть комбинированы для создания правильного текстового представления. Возможно, null если для токена нет представления байтов. Yes
top_logprobs array Список наиболее вероятных токенов и их логарифмическая вероятность на этой позиции токена. В редких случаях количество возвращённых может быть меньше, чем запрошенное top_logprobs возвращение. Yes

chatCompletionResponseMessage

Сообщение о завершении чата, генерируемое моделью.

Name Type Description Required Default
role chatCompletionResponseMessageRole Роль автора ответного сообщения. Yes
refusal string Сообщение об отказе, генерируемое моделью. Yes
content string Содержание сообщения. Yes
tool_calls array Вызовы инструментов, генерируемые моделью, такие как вызовы функций. No
function_call chatCompletionFunctionCall Устаревший и заменённый на tool_calls. Имя и аргументы функции, которую следует вызвать, как они генерируются моделью. No
context azureChatExtensionsMessageContext Представление дополнительной контекстной информации, доступной при использовании расширений чатов Azure OpenAI
в генерации соответствующего ответа на завершение чата. Эта контекстная информация заполняется только тогда, когда
используя запрос Azure OpenAI, настроенный на использование соответствующего расширения.
No

chatCompletionResponseMessageRole

Роль автора ответного сообщения.

Описание: Роль автора ответного сообщения.

Type: string

Default:

Enum Values:

  • assistant

chatCompletionToolChoiceOption

Управляет, который (если вообще есть) называется моделью. none это означает, что модель не вызывает никакой инструмент, а вместо этого генерирует сообщение. auto означает, что модель может выбирать между генерацией сообщения и вызовом одного или нескольких инструментов. required значит, модель должна вызывать один или несколько инструментов. Указание конкретного инструмента через {"type": "function", "function": {"name": "my_function"}} заставляет модель вызывать этот инструмент. none является по умолчанию, когда инструменты отсутствуют. auto является по умолчанию, если инструменты присутствуют.

Этот компонент может быть одним из следующих:

chatCompletionNamedToolChoice

Указывает инструмент, который должна использовать модель. Используй, чтобы заставить модель вызывать конкретную функцию.

Name Type Description Required Default
type enum Тип инструмента. В настоящее время поддерживается только function Only.
Возможные значения: функция
Yes
function object Yes

Свойства функции

name

Name Type Description Default
name string Название функции для вызова.

ParallelToolCalls

Можно ли включать параллельный вызов функций во время использования инструмента.

Для этого компонента не определённых свойств.

chatCompletionMessageToolCalls

Вызовы инструментов, генерируемые моделью, такие как вызовы функций.

Для этого компонента не определённых свойств.

chatCompletionFunctionCall

Устаревший и заменённый на tool_calls. Имя и аргументы функции, которую следует вызвать, как они генерируются моделью.

Name Type Description Required Default
name string Название функции для вызова. Yes
arguments string Аргументы для вызова функции, сгенерированные моделью в формате JSON. Обратите внимание, что модель не всегда генерирует валидный JSON и может генерировать параметры, не определённые вашей схемой функций. Проверьте аргументы в коде перед вызовом функции. Yes

completionUsage

Статистика использования для запроса на завершение.

Name Type Description Required Default
prompt_tokens integer Количество токенов в запросе. Yes
completion_tokens integer Количество токенов в сгенерированном завершении. Yes
total_tokens integer Общее количество токенов, использованных в запросе (запрос + завершение). Yes
completion_tokens_details object Разбивка жетонов, использованных при завершении. No

Свойства для completion_tokens_details

reasoning_tokens

Name Type Description Default
reasoning_tokens integer Токены, генерируемые моделью для рассуждения.

chatCompletionTool

Name Type Description Required Default
type enum Тип инструмента. В настоящее время поддерживается только function Only.
Возможные значения: функция
Yes
function FunctionObject Yes

FunctionParameters

Параметры, которые принимают функции, описываются как объект схемы JSON. Смотрите руководство для примеров и справочник JSON Schema для документации по формату.

Опущение parameters определяет функцию с пустым списком параметров.

Для этого компонента не определённых свойств.

FunctionObject

Name Type Description Required Default
description string Описание того, что делает функция, используемое моделью для выбора, когда и как вызывать функцию. No
name string Название функции, которую нужно вызвать. Должны быть a-z, A-Z, 0-9, или содержать подчёркивания и тире, максимальная длина — 64. Yes
parameters FunctionParameters Параметры, которые принимают функции, описываются как объект схемы JSON. Смотрите руководство для примеров и справочник JSON Schema для документации по формату.

Опущение parameters определяет функцию с пустым списком параметров.
No
strict boolean Можно ли включать строгое соблюдение схемы при генерации вызова функции. Если установить true, модель будет следовать точной схеме, parameters определённой в поле. Поддерживается только подмножество схемы JSON, когда strict .true No False

ResponseFormatText

Name Type Description Required Default
type enum Тип определяемого формата ответа: text
Возможные значения: текст
Yes

ResponseFormatJsonObject

Name Type Description Required Default
type enum Тип определяемого формата ответа: json_object
Возможные значения: json_object
Yes

ResponseFormatJsonSchemaSchema

Схема формата ответа, описываемая как объект схемы JSON.

Для этого компонента не определённых свойств.

ResponseFormatJsonSchema

Name Type Description Required Default
type enum Тип определяемого формата ответа: json_schema
Возможные значения: json_schema
Yes
json_schema object Yes

Свойства для json_schema

description

Name Type Description Default
description string Описание того, для чего предназначен формат ответа, используемое моделью для определения того, как отвечать в этом формате.

name

Name Type Description Default
name string Название формата ответа. Должны быть a-z, A-Z, 0-9, или содержать подчёркивания и тире, максимальная длина — 64.

schema

Name Type Description Default
schema ResponseFormatJsonSchemaSchema Схема формата ответа, описываемая как объект схемы JSON.

strict

Name Type Description Default
strict boolean Стоит ли включать строгое соблюдение схемы при генерации вывода. Если установить true, модель всегда будет следовать точной схеме, schema определённой в поле. Поддерживается только подмножество схемы JSON, когда strict .true False

chatCompletionChoiceCommon

Name Type Description Required Default
index integer No
finish_reason string No

createTranslationRequest

Translation request.

Name Type Description Required Default
file string Аудиофайл для перевода. Yes
prompt string Необязательный текст для руководства стилем модели или продолжения предыдущего аудиосегмента. Задание должно быть на английском. No
response_format audioResponseFormat Определяет формат выхода. No
temperature number Температура выборки — от 0 до 1. Более высокие значения, например 0.8, делают выход более случайным, а низкие, например 0.2, делают его более сфокусированным и детерминированным. Если установлено в 0, модель будет использовать логарифмическую вероятность для автоматического повышения температуры до достижения определённых порогов. No 0

audioResponse

Ответ перевода или транскрипции, когда response_format был json

Name Type Description Required Default
text string Переведённый или расшифрованный текст. Yes

audioVerboseResponse

Ответ на перевод или транскрипцию, когда response_format был verbose_json

Name Type Description Required Default
text string Переведённый или расшифрованный текст. Yes
task string Тип аудиозадачи. No
language string Language. No
duration number Duration. No
segments array No

audioResponseFormat

Определяет формат выхода.

Описание: Определяет формат выхода.

Type: string

Default:

Enum Values:

  • json
  • text
  • srt
  • verbose_json
  • vtt

createTranscriptionRequest

Transcription request.

Name Type Description Required Default
file string Аудиофайл возражает для транскрибации. Yes
prompt string Необязательный текст для руководства стилем модели или продолжения предыдущего аудиосегмента. Запрос должен соответствовать языку аудио. No
response_format audioResponseFormat Определяет формат выхода. No
temperature number Температура выборки — от 0 до 1. Более высокие значения, например 0.8, делают выход более случайным, а низкие, например 0.2, делают его более сфокусированным и детерминированным. Если установлено в 0, модель будет использовать логарифмическую вероятность для автоматического повышения температуры до достижения определённых порогов. No 0
language string Язык входного аудио. Предоставление языка ввода в формате ISO-639-1 повысит точность и задержку. No

audioSegment

Сегмент транскрипции или перевода.

Name Type Description Required Default
id integer Segment identifier. No
seek number Смещение сегмента. No
start number Смещение старта сегмента. No
end number Смещение конца сегмента. No
text string Segment text. No
tokens array Символы текста. No
temperature number Temperature. No
avg_logprob number Средняя логарифмическая вероятность. No
compression_ratio number Compression ratio. No
no_speech_prob number Вероятность no speech. No

imageQuality

Качество изображения, которое будет создано.

Описание: Качество изображения, которое будет создано.

Type: string

Default: standard

Имя Enum: Качество

Enum Values:

Value Description
standard Стандартное качество создаёт изображения со стандартным качеством.
hd HD-качество создает изображения с более мелкими деталями и большей согласованностью по всему изображению.

imagesResponseFormat

Формат, в котором возвращаются сгенерированные изображения.

Описание: формат, в котором возвращаются сгенерированные изображения.

Type: string

Default: url

Имя enum: ImagesResponseFormat

Enum Values:

Value Description
url URL, предоставляющий временный доступ для загрузки сгенерированных изображений.
b64_json Сгенерированные изображения возвращаются в виде строк, закодированных в базе 64.

imageSize

Размер сгенерированных изображений.

Описание: размер сгенерированных изображений.

Type: string

Default: 1024x1024

Имя энума: размер

Enum Values:

Value Description
1792x1024 Желаемый размер сгенерированного изображения составляет 1792x1024 пикселя.
1024x1792 Желаемый размер сгенерированного изображения составляет 1024x1792 пикселя.
1024x1024 Желаемый размер сгенерированного изображения составляет 1024x1024 пикселя.

imageStyle

Стиль сгенерированных изображений.

Описание: Стиль сгенерированных изображений.

Type: string

Default: vivid

Имя Энума: Стиль

Enum Values:

Value Description
vivid Vivid создаёт гиперреалистичные и драматичные изображения.
natural Natural создаёт более естественные и менее гиперреалистичные изображения.

imageGenerationsRequest

Name Type Description Required Default
prompt string Текстовое описание желаемого изображения(ов). Максимальная длина — 4 000 символов. Yes
n integer Количество изображений для генерации. No 1
size imageSize Размер сгенерированных изображений. No 1024x1024
response_format imagesResponseFormat Формат, в котором возвращаются сгенерированные изображения. No url
user string Уникальный идентификатор, представляющий вашего конечного пользователя, который помогает отслеживать и выявлять злоупотребления. No
quality imageQuality Качество изображения, которое будет создано. No standard
style imageStyle Стиль сгенерированных изображений. No vivid

generateImagesResponse

Name Type Description Required Default
created integer Временная метка Unix при создании операции. Yes
data array Результаты операции, если успешны Yes

imageResult

URL изображения или закодированное изображение, если успешно, а в противном случае — ошибка.

Name Type Description Required Default
url string URL изображения. No
b64_json string Кодируемое изображение base64 No
content_filter_results dalleContentFilterResults Информация о результатах фильтрации контента. No
revised_prompt string Подсказка, которая использовалась для создания изображения, если произошла какая-либо коррекция. No
prompt_filter_results dalleFilterResults Информация о категории фильтрации контента (ненависть, сексуальное, насилие self_harm), выявлена ли она, а также уровень тяжести (very_low, низкий, средний, высокий масштаб, определяющий интенсивность и уровень риска вредного контента) и была ли она отфильтрована. Информация о джейлбрейк-контенте и нецензурной лексике, были ли они обнаружены и были ли отфильтрованы или нет. И информация о списке блокировки клиентов, если он был отфильтрован, и его идентификаторе. No

Completions extensions

Расширения завершений не входят в последнюю GA версию спецификации Azure OpenAI data plane inference.

Chatmessage

Объект сообщения Chat не входит в последнюю GA версию спецификации выведения плоскости данных Azure OpenAI.

Текст в речь (Предварительный просмотр)

В настоящее время не входит в последнюю версию Azure OpenAI GA спецификаци Azure и OpenAI Data Plane inference. Для этой возможности обратитесь к последней версии preview.

Next steps

Узнайте о моделях и тонкой настройке с помощью REST API. Узнайте больше о недоумение моделей, которые Azure OpenAI.