Content Analyzers - Create Or Replace
Создайте новый анализатор асинхронно.
PUT {endpoint}/contentunderstanding/analyzers/{analyzerId}?api-version=2025-11-01
PUT {endpoint}/contentunderstanding/analyzers/{analyzerId}?api-version=2025-11-01&allowReplace={allowReplace}
Параметры URI
| Имя | В | Обязательно | Тип | Описание |
|---|---|---|---|---|
|
analyzer
|
path | True |
string minLength: 1maxLength: 64 pattern: ^[a-zA-Z0-9._-]{1,64}$ |
Уникальный идентификатор анализатора. |
|
endpoint
|
path | True |
string (uri) |
Понимание контента: конечная точка сервиса. |
|
api-version
|
query | True |
string minLength: 1 |
Версия API, используемая для данной операции. |
|
allow
|
query |
boolean |
Позволить операции заменить существующий ресурс. |
Заголовок запроса
| Имя | Обязательно | Тип | Описание |
|---|---|---|---|
| x-ms-client-request-id |
string (uuid) |
Непрозрачный, глобально уникальный, созданный клиентом идентификатор строки для запроса. |
Текст запроса
| Имя | Тип | Описание |
|---|---|---|
| baseAnalyzerId |
string minLength: 1maxLength: 64 pattern: ^[a-zA-Z0-9._-]{1,64}$ |
Анализатор для постепенного обучения. |
| config |
Настройки конфигурации анализатора. |
|
| description |
string |
Описание анализатора. |
| dynamicFieldSchema |
boolean |
Указывает, может ли результат содержать дополнительные поля вне определённой схемы. |
| fieldSchema |
Схема полей для извлечения. |
|
| knowledgeSources | KnowledgeSource[]: |
Дополнительные источники знаний используются для улучшения анализатора. |
| models |
object |
Сопоставление ролей моделей с конкретными названиями моделей. Например: { "завершение": "gpt-4.1", "embedding": "text-embedding-3-large" }. |
| processingLocation |
Место, где могут обрабатываться данные. По умолчанию — глобальный. |
|
| tags |
object |
Теги, связанные с анализатором. |
Ответы
| Имя | Тип | Описание |
|---|---|---|
| 200 OK |
Запрос выполнен успешно. Заголовки
|
|
| 201 Created |
Запрос успешно выполнен, и в результате был создан новый ресурс. Заголовки
|
|
| Other Status Codes |
Непредвиденное сообщение об ошибке. Заголовки x-ms-error-code: string |
Безопасность
Ocp-Apim-Subscription-Key
Аутентификация по ключу с использованием ключа доступа ресурса Azure.
Тип:
apiKey
В:
header
EntraIdToken
Аутентификация Microsoft Entra ID OAuth2 с использованием токена доступа.
Тип:
oauth2
Flow:
accessCode
URL-адрес авторизации:
https://login.microsoftonline.com/common/oauth2/authorize
URL-адрес токена:
https://login.microsoftonline.com/common/oauth2/token
Области
| Имя | Описание |
|---|---|
| https://cognitiveservices.azure.com/.default |
Примеры
Create or Replace Analyzer
Образец запроса
PUT {endpoint}/contentunderstanding/analyzers/myAnalyzer?api-version=2025-11-01
{
"description": "My analyzer",
"tags": {
"createdBy": "John"
},
"baseAnalyzerId": "prebuilt-document",
"config": {
"enableFormula": false,
"returnDetails": true
},
"fieldSchema": {
"name": "MyForm",
"description": "My form",
"fields": {
"Company": {
"type": "string",
"description": "Name of company."
}
},
"definitions": {}
},
"knowledgeSources": [
{
"kind": "labeledData",
"containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer",
"prefix": "trainingData",
"fileListPath": "trainingData/fileList.jsonl"
}
]
}
Пример ответа
Operation-Location: https://myendpoint.cognitiveservices.azure.com/contentunderstanding/analyzers/myAnalyzer/operations/3b31320d-8bab-4f88-b19c-2322a7f11034?api-version=2025-11-01
{
"analyzerId": "myAnalyzer",
"description": "My analyzer",
"tags": {
"createdBy": "John"
},
"status": "creating",
"createdAt": "2025-05-01T18:46:36.051Z",
"lastModifiedAt": "2025-05-01T18:46:36.051Z",
"baseAnalyzerId": "prebuilt-document",
"config": {
"locales": null,
"enableOcr": true,
"enableLayout": true,
"enableFormula": false,
"returnDetails": true
},
"fieldSchema": {
"name": "MyForm",
"description": "My form",
"fields": {
"Company": {
"type": "string",
"description": "Name of company."
}
},
"definitions": {}
},
"knowledgeSources": [
{
"kind": "labeledData",
"containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer",
"prefix": "trainingData",
"fileListPath": "trainingData/fileList.jsonl"
}
]
}
Operation-Location: https://myendpoint.cognitiveservices.azure.com/contentunderstanding/analyzers/myAnalyzer/operations/3b31320d-8bab-4f88-b19c-2322a7f11034?api-version=2025-11-01
{
"analyzerId": "myAnalyzer",
"description": "My analyzer",
"tags": {
"createdBy": "John"
},
"status": "creating",
"createdAt": "2025-05-01T18:46:36.051Z",
"lastModifiedAt": "2025-05-01T18:46:36.051Z",
"baseAnalyzerId": "prebuilt-document",
"config": {
"locales": null,
"enableOcr": true,
"enableLayout": true,
"enableFormula": false,
"returnDetails": true
},
"fieldSchema": {
"name": "MyForm",
"description": "My form",
"fields": {
"Company": {
"type": "string",
"description": "Name of company."
}
},
"definitions": {}
},
"knowledgeSources": [
{
"kind": "labeledData",
"containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer",
"prefix": "trainingData",
"fileListPath": "trainingData/fileList.jsonl"
}
]
}
Определения
| Имя | Описание |
|---|---|
|
Annotation |
Формат представления аннотаций в анализе результатов markdown. |
|
Azure. |
Объект ошибки. |
|
Azure. |
Ответ, содержащий сведения об ошибке. |
|
Azure. |
Объект, содержащий более конкретные сведения об ошибке. В соответствии с рекомендациями по Azure REST API — https://aka.ms/AzureRestApiGuidelines#handling-errors. |
|
Chart |
Формат представления графиков в анализе результатов markdown. |
|
Content |
Анализатор, извлекающий содержимое и поля из мультимодальных документов. |
|
Content |
Настройки конфигурации анализатора. |
|
Content |
Статус ресурса. |
|
Content |
Определение категории контента. |
|
Content |
Определение поля с помощью синтаксиса, похожего на схему JSON. |
|
Content |
Схема полей, которые нужно извлекать из документов. |
|
Content |
Семантический тип данных значения поля. |
|
Generation |
Метод генерации. |
|
Knowledge |
Источник знаний. |
|
Labeled |
Обозначенный источник данных о знаниях. |
|
Processing |
Место, где могут обрабатываться данные. По умолчанию — глобальный. |
|
Supported |
Модели завершения и вложения чата, поддерживаемые анализатором. |
|
Table |
Формат представления таблиц в анализе результата markdown. |
AnnotationFormat
Формат представления аннотаций в анализе результатов markdown.
| Значение | Описание |
|---|---|
| none |
Не представляйте аннотации. |
| markdown |
Представить базовую информацию об аннотациях с помощью форматирования markdown. |
Azure.Core.Foundations.Error
Объект ошибки.
| Имя | Тип | Описание |
|---|---|---|
| code |
string |
Один из определяемых сервером кодов ошибок. |
| details |
Массив сведений об определенных ошибках, которые привели к этой сообщаемой ошибке. |
|
| innererror |
Объект, содержащий более конкретные сведения, чем текущий объект об ошибке. |
|
| message |
string |
Читаемое пользователем представление ошибки. |
| target |
string |
Целевой объект ошибки. |
Azure.Core.Foundations.ErrorResponse
Ответ, содержащий сведения об ошибке.
| Имя | Тип | Описание |
|---|---|---|
| error |
Объект ошибки. |
Azure.Core.Foundations.InnerError
Объект, содержащий более конкретные сведения об ошибке. В соответствии с рекомендациями по Azure REST API — https://aka.ms/AzureRestApiGuidelines#handling-errors.
| Имя | Тип | Описание |
|---|---|---|
| code |
string |
Один из определяемых сервером кодов ошибок. |
| innererror |
Внутренняя ошибка. |
ChartFormat
Формат представления графиков в анализе результатов markdown.
| Значение | Описание |
|---|---|
| chartJs |
Представляйте диаграммы в виде Chart.js кодовых блоков. |
| markdown |
Представляйте графики в виде таблиц с уценками. |
ContentAnalyzer
Анализатор, извлекающий содержимое и поля из мультимодальных документов.
| Имя | Тип | Default value | Описание |
|---|---|---|---|
| analyzerId |
string minLength: 1maxLength: 64 pattern: ^[a-zA-Z0-9._-]{1,64}$ |
Уникальный идентификатор анализатора. |
|
| baseAnalyzerId |
string minLength: 1maxLength: 64 pattern: ^[a-zA-Z0-9._-]{1,64}$ |
Анализатор для постепенного обучения. |
|
| config |
Настройки конфигурации анализатора. |
||
| createdAt |
string (date-time) |
Дата и время создания анализатора. |
|
| description |
string |
Описание анализатора. |
|
| dynamicFieldSchema |
boolean |
False |
Указывает, может ли результат содержать дополнительные поля вне определённой схемы. |
| fieldSchema |
Схема полей для извлечения. |
||
| knowledgeSources | KnowledgeSource[]: |
Дополнительные источники знаний используются для улучшения анализатора. |
|
| lastModifiedAt |
string (date-time) |
Дата и время последней модификации анализатора. |
|
| models |
object |
Сопоставление ролей моделей с конкретными названиями моделей. Например: { "завершение": "gpt-4.1", "embedding": "text-embedding-3-large" }. |
|
| processingLocation | global |
Место, где могут обрабатываться данные. По умолчанию — глобальный. |
|
| status |
Статус анализатора. |
||
| supportedModels |
Модели завершения и вложения чата, поддерживаемые анализатором. |
||
| tags |
object |
Теги, связанные с анализатором. |
|
| warnings |
Предупреждения, встречающиеся при создании анализатора. |
ContentAnalyzerConfig
Настройки конфигурации анализатора.
| Имя | Тип | Default value | Описание |
|---|---|---|---|
| annotationFormat | markdown |
Формат представления аннотаций в анализе результатов markdown. |
|
| chartFormat | chartJs |
Формат представления графиков в анализе результатов markdown. |
|
| contentCategories |
<string,
Content |
Карта категорий для классификации входного содержания. |
|
| disableFaceBlurring |
boolean |
Отключите стандартное размытие лиц для конфиденциальности во время обработки контента. |
|
| enableFigureAnalysis |
boolean |
Включайте анализ рисунков, таких как диаграммы и диаграммы. |
|
| enableFigureDescription |
boolean |
Включите генерацию описания фигур. |
|
| enableFormula |
boolean |
Включить обнаружение математических формул. |
|
| enableLayout |
boolean |
Включите анализ макета. |
|
| enableOcr |
boolean |
Включите оптическое распознавание символов (OCR). |
|
| enableSegment |
boolean |
Включить сегментацию входных данных по contentCategories. |
|
| estimateFieldSourceAndConfidence |
boolean |
Источник заземления и уверенность в ответном поле. |
|
| locales |
string[] |
Список подсказок по местонахождению для транскрипции речи. |
|
| omitContent |
boolean |
Исключите содержимое этого анализатора из результатов анализа. Возвращать только содержимое из дополнительных анализаторов, указанных в contentCategories, если таковые есть. |
|
| returnDetails |
boolean |
Вернуть все детали содержания. |
|
| segmentPerPage |
boolean |
Принудительно сегментировать содержимое документа по страницам. |
|
| tableFormat | html |
Формат представления таблиц в анализе результата markdown. |
ContentAnalyzerStatus
Статус ресурса.
| Значение | Описание |
|---|---|
| creating |
Ресурс создается. |
| ready |
Ресурс готов. |
| deleting |
Ресурс удаляется. |
| failed |
Ресурс вышел из строя во время создания. |
ContentCategoryDefinition
Определение категории контента.
| Имя | Тип | Описание |
|---|---|---|
| analyzer |
Необязательное встроенное определение анализатора, используемое для обработки содержимого. |
|
| analyzerId |
string |
Необязательный анализатор для обработки содержимого. |
| description |
string |
Описание категории. |
ContentFieldDefinition
Определение поля с помощью синтаксиса, похожего на схему JSON.
| Имя | Тип | Описание |
|---|---|---|
| $ref |
string |
Ссылка на другое определение поля. |
| description |
string |
Описание поля. |
| enum |
string[] |
Перечисление возможных значений полей. |
| enumDescriptions |
object |
Описания для каждого значения перечисления. |
| estimateSourceAndConfidence |
boolean |
Возвращайте источник заземления и уверенность. |
| examples |
string[] |
Примеры значений полей. |
| items |
Схема типа поля каждого элемента массива, если тип — массив. |
|
| method |
Метод генерации. |
|
| properties |
<string,
Content |
Именованные подполя, если тип — объект. |
| type |
Семантический тип данных значения поля. |
ContentFieldSchema
Схема полей, которые нужно извлекать из документов.
| Имя | Тип | Описание |
|---|---|---|
| definitions |
<string,
Content |
Дополнительные определения, на которые ссылаются поля схемы. |
| description |
string |
Описание полевой схемы. |
| fields |
<string,
Content |
Поля, определённые в схеме. |
| name |
string |
Название полевой схемы. |
ContentFieldType
Семантический тип данных значения поля.
| Значение | Описание |
|---|---|
| string |
Обычный текст. |
| date |
Дата, нормализована до формата ISO 8601 (ГГГГ-MM-DD). |
| time |
Время, нормализованное до формата ISO 8601 (hh:mm:ss). |
| number |
Число с двойной точностью с плавающей точкой. |
| integer |
Целое число как 64-битное знаковатое целое число. |
| boolean |
Логическое значение. |
| array |
Список подполей одного типа. |
| object |
Названный список подполей. |
| json |
JSON. |
GenerationMethod
Метод генерации.
| Значение | Описание |
|---|---|
| generate |
Значения генерируются свободно на основе содержания. |
| extract |
Значения извлекаются по мере их появления в содержимом. |
| classify |
Значения классифицируются по заранее определённому набору категорий. |
KnowledgeSourceKind
Источник знаний.
| Значение | Описание |
|---|---|
| labeledData |
Маркированный источник знаний данных. |
LabeledDataKnowledgeSource
Обозначенный источник данных о знаниях.
| Имя | Тип | Описание |
|---|---|---|
| containerUrl |
string (uri) |
URL blob-контейнера, содержащего помеченные данные. |
| fileListPath |
string |
Необязательный путь к файлу с перечислением конкретных blob-ов для включения. |
| kind |
string:
labeled |
Источник знаний. |
| prefix |
string |
Необязательный префикс для фильтрации скоплений внутри контейнера. |
ProcessingLocation
Место, где могут обрабатываться данные. По умолчанию — глобальный.
| Значение | Описание |
|---|---|
| geography |
Данные могут обрабатываться в той же географии, что и ресурс. |
| dataZone |
Данные могут обрабатываться в той же зоне данных, что и ресурс. |
| global |
Данные могут обрабатываться в любом дата-центре Azure по всему миру. |
SupportedModels
Модели завершения и вложения чата, поддерживаемые анализатором.
| Имя | Тип | Описание |
|---|---|---|
| completion |
string[] |
Модели завершения чата, поддерживаемые анализатором. |
| embedding |
string[] |
Модели вложения, поддерживаемые анализатором. |
TableFormat
Формат представления таблиц в анализе результата markdown.
| Значение | Описание |
|---|---|
| html |
Представлять таблицы с помощью элементов HTML-таблицы: <table>, <th>, <tr>, <td>. |
| markdown |
Представлять таблицы с помощью синтаксиса таблицы GitHub Flavored Markdown, который не поддерживает объединённые ячейки или богатые заголовки. |