Content Analyzers - Create Or Replace

Создайте новый анализатор асинхронно.

PUT {endpoint}/contentunderstanding/analyzers/{analyzerId}?api-version=2025-11-01
PUT {endpoint}/contentunderstanding/analyzers/{analyzerId}?api-version=2025-11-01&allowReplace={allowReplace}

Параметры URI

Имя В Обязательно Тип Описание
analyzerId
path True

string

minLength: 1
maxLength: 64
pattern: ^[a-zA-Z0-9._-]{1,64}$

Уникальный идентификатор анализатора.

endpoint
path True

string (uri)

Понимание контента: конечная точка сервиса.

api-version
query True

string

minLength: 1

Версия API, используемая для данной операции.

allowReplace
query

boolean

Позволить операции заменить существующий ресурс.

Заголовок запроса

Имя Обязательно Тип Описание
x-ms-client-request-id

string (uuid)

Непрозрачный, глобально уникальный, созданный клиентом идентификатор строки для запроса.

Текст запроса

Имя Тип Описание
baseAnalyzerId

string

minLength: 1
maxLength: 64
pattern: ^[a-zA-Z0-9._-]{1,64}$

Анализатор для постепенного обучения.

config

ContentAnalyzerConfig

Настройки конфигурации анализатора.

description

string

Описание анализатора.

dynamicFieldSchema

boolean

Указывает, может ли результат содержать дополнительные поля вне определённой схемы.

fieldSchema

ContentFieldSchema

Схема полей для извлечения.

knowledgeSources KnowledgeSource[]:

LabeledDataKnowledgeSource[]

Дополнительные источники знаний используются для улучшения анализатора.

models

object

Сопоставление ролей моделей с конкретными названиями моделей. Например: { "завершение": "gpt-4.1", "embedding": "text-embedding-3-large" }.

processingLocation

ProcessingLocation

Место, где могут обрабатываться данные. По умолчанию — глобальный.

tags

object

Теги, связанные с анализатором.

Ответы

Имя Тип Описание
200 OK

ContentAnalyzer

Запрос выполнен успешно.

Заголовки

  • Operation-Location: string
  • x-ms-client-request-id: string
201 Created

ContentAnalyzer

Запрос успешно выполнен, и в результате был создан новый ресурс.

Заголовки

  • Operation-Location: string
  • x-ms-client-request-id: string
Other Status Codes

Azure.Core.Foundations.ErrorResponse

Непредвиденное сообщение об ошибке.

Заголовки

x-ms-error-code: string

Безопасность

Ocp-Apim-Subscription-Key

Аутентификация по ключу с использованием ключа доступа ресурса Azure.

Тип: apiKey
В: header

EntraIdToken

Аутентификация Microsoft Entra ID OAuth2 с использованием токена доступа.

Тип: oauth2
Flow: accessCode
URL-адрес авторизации: https://login.microsoftonline.com/common/oauth2/authorize
URL-адрес токена: https://login.microsoftonline.com/common/oauth2/token

Области

Имя Описание
https://cognitiveservices.azure.com/.default

Примеры

Create or Replace Analyzer

Образец запроса

PUT {endpoint}/contentunderstanding/analyzers/myAnalyzer?api-version=2025-11-01

{
  "description": "My analyzer",
  "tags": {
    "createdBy": "John"
  },
  "baseAnalyzerId": "prebuilt-document",
  "config": {
    "enableFormula": false,
    "returnDetails": true
  },
  "fieldSchema": {
    "name": "MyForm",
    "description": "My form",
    "fields": {
      "Company": {
        "type": "string",
        "description": "Name of company."
      }
    },
    "definitions": {}
  },
  "knowledgeSources": [
    {
      "kind": "labeledData",
      "containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer",
      "prefix": "trainingData",
      "fileListPath": "trainingData/fileList.jsonl"
    }
  ]
}

Пример ответа

Operation-Location: https://myendpoint.cognitiveservices.azure.com/contentunderstanding/analyzers/myAnalyzer/operations/3b31320d-8bab-4f88-b19c-2322a7f11034?api-version=2025-11-01
{
  "analyzerId": "myAnalyzer",
  "description": "My analyzer",
  "tags": {
    "createdBy": "John"
  },
  "status": "creating",
  "createdAt": "2025-05-01T18:46:36.051Z",
  "lastModifiedAt": "2025-05-01T18:46:36.051Z",
  "baseAnalyzerId": "prebuilt-document",
  "config": {
    "locales": null,
    "enableOcr": true,
    "enableLayout": true,
    "enableFormula": false,
    "returnDetails": true
  },
  "fieldSchema": {
    "name": "MyForm",
    "description": "My form",
    "fields": {
      "Company": {
        "type": "string",
        "description": "Name of company."
      }
    },
    "definitions": {}
  },
  "knowledgeSources": [
    {
      "kind": "labeledData",
      "containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer",
      "prefix": "trainingData",
      "fileListPath": "trainingData/fileList.jsonl"
    }
  ]
}
Operation-Location: https://myendpoint.cognitiveservices.azure.com/contentunderstanding/analyzers/myAnalyzer/operations/3b31320d-8bab-4f88-b19c-2322a7f11034?api-version=2025-11-01
{
  "analyzerId": "myAnalyzer",
  "description": "My analyzer",
  "tags": {
    "createdBy": "John"
  },
  "status": "creating",
  "createdAt": "2025-05-01T18:46:36.051Z",
  "lastModifiedAt": "2025-05-01T18:46:36.051Z",
  "baseAnalyzerId": "prebuilt-document",
  "config": {
    "locales": null,
    "enableOcr": true,
    "enableLayout": true,
    "enableFormula": false,
    "returnDetails": true
  },
  "fieldSchema": {
    "name": "MyForm",
    "description": "My form",
    "fields": {
      "Company": {
        "type": "string",
        "description": "Name of company."
      }
    },
    "definitions": {}
  },
  "knowledgeSources": [
    {
      "kind": "labeledData",
      "containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer",
      "prefix": "trainingData",
      "fileListPath": "trainingData/fileList.jsonl"
    }
  ]
}

Определения

Имя Описание
AnnotationFormat

Формат представления аннотаций в анализе результатов markdown.

Azure.Core.Foundations.Error

Объект ошибки.

Azure.Core.Foundations.ErrorResponse

Ответ, содержащий сведения об ошибке.

Azure.Core.Foundations.InnerError

Объект, содержащий более конкретные сведения об ошибке. В соответствии с рекомендациями по Azure REST API — https://aka.ms/AzureRestApiGuidelines#handling-errors.

ChartFormat

Формат представления графиков в анализе результатов markdown.

ContentAnalyzer

Анализатор, извлекающий содержимое и поля из мультимодальных документов.

ContentAnalyzerConfig

Настройки конфигурации анализатора.

ContentAnalyzerStatus

Статус ресурса.

ContentCategoryDefinition

Определение категории контента.

ContentFieldDefinition

Определение поля с помощью синтаксиса, похожего на схему JSON.

ContentFieldSchema

Схема полей, которые нужно извлекать из документов.

ContentFieldType

Семантический тип данных значения поля.

GenerationMethod

Метод генерации.

KnowledgeSourceKind

Источник знаний.

LabeledDataKnowledgeSource

Обозначенный источник данных о знаниях.

ProcessingLocation

Место, где могут обрабатываться данные. По умолчанию — глобальный.

SupportedModels

Модели завершения и вложения чата, поддерживаемые анализатором.

TableFormat

Формат представления таблиц в анализе результата markdown.

AnnotationFormat

Формат представления аннотаций в анализе результатов markdown.

Значение Описание
none

Не представляйте аннотации.

markdown

Представить базовую информацию об аннотациях с помощью форматирования markdown.

Azure.Core.Foundations.Error

Объект ошибки.

Имя Тип Описание
code

string

Один из определяемых сервером кодов ошибок.

details

Azure.Core.Foundations.Error[]

Массив сведений об определенных ошибках, которые привели к этой сообщаемой ошибке.

innererror

Azure.Core.Foundations.InnerError

Объект, содержащий более конкретные сведения, чем текущий объект об ошибке.

message

string

Читаемое пользователем представление ошибки.

target

string

Целевой объект ошибки.

Azure.Core.Foundations.ErrorResponse

Ответ, содержащий сведения об ошибке.

Имя Тип Описание
error

Azure.Core.Foundations.Error

Объект ошибки.

Azure.Core.Foundations.InnerError

Объект, содержащий более конкретные сведения об ошибке. В соответствии с рекомендациями по Azure REST API — https://aka.ms/AzureRestApiGuidelines#handling-errors.

Имя Тип Описание
code

string

Один из определяемых сервером кодов ошибок.

innererror

Azure.Core.Foundations.InnerError

Внутренняя ошибка.

ChartFormat

Формат представления графиков в анализе результатов markdown.

Значение Описание
chartJs

Представляйте диаграммы в виде Chart.js кодовых блоков.

markdown

Представляйте графики в виде таблиц с уценками.

ContentAnalyzer

Анализатор, извлекающий содержимое и поля из мультимодальных документов.

Имя Тип Default value Описание
analyzerId

string

minLength: 1
maxLength: 64
pattern: ^[a-zA-Z0-9._-]{1,64}$

Уникальный идентификатор анализатора.

baseAnalyzerId

string

minLength: 1
maxLength: 64
pattern: ^[a-zA-Z0-9._-]{1,64}$

Анализатор для постепенного обучения.

config

ContentAnalyzerConfig

Настройки конфигурации анализатора.

createdAt

string (date-time)

Дата и время создания анализатора.

description

string

Описание анализатора.

dynamicFieldSchema

boolean

False

Указывает, может ли результат содержать дополнительные поля вне определённой схемы.

fieldSchema

ContentFieldSchema

Схема полей для извлечения.

knowledgeSources KnowledgeSource[]:

LabeledDataKnowledgeSource[]

Дополнительные источники знаний используются для улучшения анализатора.

lastModifiedAt

string (date-time)

Дата и время последней модификации анализатора.

models

object

Сопоставление ролей моделей с конкретными названиями моделей. Например: { "завершение": "gpt-4.1", "embedding": "text-embedding-3-large" }.

processingLocation

ProcessingLocation

global

Место, где могут обрабатываться данные. По умолчанию — глобальный.

status

ContentAnalyzerStatus

Статус анализатора.

supportedModels

SupportedModels

Модели завершения и вложения чата, поддерживаемые анализатором.

tags

object

Теги, связанные с анализатором.

warnings

Azure.Core.Foundations.Error[]

Предупреждения, встречающиеся при создании анализатора.

ContentAnalyzerConfig

Настройки конфигурации анализатора.

Имя Тип Default value Описание
annotationFormat

AnnotationFormat

markdown

Формат представления аннотаций в анализе результатов markdown.

chartFormat

ChartFormat

chartJs

Формат представления графиков в анализе результатов markdown.

contentCategories

<string,  ContentCategoryDefinition>

Карта категорий для классификации входного содержания.

disableFaceBlurring

boolean

Отключите стандартное размытие лиц для конфиденциальности во время обработки контента.

enableFigureAnalysis

boolean

Включайте анализ рисунков, таких как диаграммы и диаграммы.

enableFigureDescription

boolean

Включите генерацию описания фигур.

enableFormula

boolean

Включить обнаружение математических формул.

enableLayout

boolean

Включите анализ макета.

enableOcr

boolean

Включите оптическое распознавание символов (OCR).

enableSegment

boolean

Включить сегментацию входных данных по contentCategories.

estimateFieldSourceAndConfidence

boolean

Источник заземления и уверенность в ответном поле.

locales

string[]

Список подсказок по местонахождению для транскрипции речи.

omitContent

boolean

Исключите содержимое этого анализатора из результатов анализа. Возвращать только содержимое из дополнительных анализаторов, указанных в contentCategories, если таковые есть.

returnDetails

boolean

Вернуть все детали содержания.

segmentPerPage

boolean

Принудительно сегментировать содержимое документа по страницам.

tableFormat

TableFormat

html

Формат представления таблиц в анализе результата markdown.

ContentAnalyzerStatus

Статус ресурса.

Значение Описание
creating

Ресурс создается.

ready

Ресурс готов.

deleting

Ресурс удаляется.

failed

Ресурс вышел из строя во время создания.

ContentCategoryDefinition

Определение категории контента.

Имя Тип Описание
analyzer

ContentAnalyzer

Необязательное встроенное определение анализатора, используемое для обработки содержимого.

analyzerId

string

Необязательный анализатор для обработки содержимого.

description

string

Описание категории.

ContentFieldDefinition

Определение поля с помощью синтаксиса, похожего на схему JSON.

Имя Тип Описание
$ref

string

Ссылка на другое определение поля.

description

string

Описание поля.

enum

string[]

Перечисление возможных значений полей.

enumDescriptions

object

Описания для каждого значения перечисления.

estimateSourceAndConfidence

boolean

Возвращайте источник заземления и уверенность.

examples

string[]

Примеры значений полей.

items

ContentFieldDefinition

Схема типа поля каждого элемента массива, если тип — массив.

method

GenerationMethod

Метод генерации.

properties

<string,  ContentFieldDefinition>

Именованные подполя, если тип — объект.

type

ContentFieldType

Семантический тип данных значения поля.

ContentFieldSchema

Схема полей, которые нужно извлекать из документов.

Имя Тип Описание
definitions

<string,  ContentFieldDefinition>

Дополнительные определения, на которые ссылаются поля схемы.

description

string

Описание полевой схемы.

fields

<string,  ContentFieldDefinition>

Поля, определённые в схеме.

name

string

Название полевой схемы.

ContentFieldType

Семантический тип данных значения поля.

Значение Описание
string

Обычный текст.

date

Дата, нормализована до формата ISO 8601 (ГГГГ-MM-DD).

time

Время, нормализованное до формата ISO 8601 (hh:mm:ss).

number

Число с двойной точностью с плавающей точкой.

integer

Целое число как 64-битное знаковатое целое число.

boolean

Логическое значение.

array

Список подполей одного типа.

object

Названный список подполей.

json

JSON.

GenerationMethod

Метод генерации.

Значение Описание
generate

Значения генерируются свободно на основе содержания.

extract

Значения извлекаются по мере их появления в содержимом.

classify

Значения классифицируются по заранее определённому набору категорий.

KnowledgeSourceKind

Источник знаний.

Значение Описание
labeledData

Маркированный источник знаний данных.

LabeledDataKnowledgeSource

Обозначенный источник данных о знаниях.

Имя Тип Описание
containerUrl

string (uri)

URL blob-контейнера, содержащего помеченные данные.

fileListPath

string

Необязательный путь к файлу с перечислением конкретных blob-ов для включения.

kind string:

labeledData

Источник знаний.

prefix

string

Необязательный префикс для фильтрации скоплений внутри контейнера.

ProcessingLocation

Место, где могут обрабатываться данные. По умолчанию — глобальный.

Значение Описание
geography

Данные могут обрабатываться в той же географии, что и ресурс.

dataZone

Данные могут обрабатываться в той же зоне данных, что и ресурс.

global

Данные могут обрабатываться в любом дата-центре Azure по всему миру.

SupportedModels

Модели завершения и вложения чата, поддерживаемые анализатором.

Имя Тип Описание
completion

string[]

Модели завершения чата, поддерживаемые анализатором.

embedding

string[]

Модели вложения, поддерживаемые анализатором.

TableFormat

Формат представления таблиц в анализе результата markdown.

Значение Описание
html

Представлять таблицы с помощью элементов HTML-таблицы: <table>, <th>, <tr>, <td>.

markdown

Представлять таблицы с помощью синтаксиса таблицы GitHub Flavored Markdown, который не поддерживает объединённые ячейки или богатые заголовки.