Skillsets - Create Or Update
Создает новый набор навыков в службе поиска или обновляет набор навыков, если он уже существует.
PUT {endpoint}/skillsets('{skillsetName}')?api-version=2025-09-01
Параметры URI
| Имя | В | Обязательно | Тип | Описание |
|---|---|---|---|---|
|
endpoint
|
path | True |
string |
URL-адрес конечной точки службы поиска. |
|
skillset
|
path | True |
string |
Имя набора навыков, который нужно создать или обновить. |
|
api-version
|
query | True |
string |
Версия клиентского API. |
Заголовок запроса
| Имя | Обязательно | Тип | Описание |
|---|---|---|---|
| x-ms-client-request-id |
string (uuid) |
Идентификатор отслеживания, отправленный вместе с запросом на помощь в отладке. |
|
| If-Match |
string |
Определяет условие If-Match. Операция будет выполнена только в том случае, если ETag на сервере соответствует этому значению. |
|
| If-None-Match |
string |
Определяет условие If-None-Match. Операция будет выполнена только в том случае, если ETag на сервере не соответствует этому значению. |
|
| Prefer | True |
string |
Для запросов HTTP PUT указывает службе вернуть созданный или обновленный ресурс при успешном выполнении. |
Текст запроса
| Имя | Обязательно | Тип | Описание |
|---|---|---|---|
| name | True |
string |
Название набора навыков. |
| skills | True |
SearchIndexerSkill[]:
|
Список навыков в наборе навыков. |
| @odata.etag |
string |
ETag набора навыков. |
|
| cognitiveServices | CognitiveServicesAccount: |
Подробные сведения о службе Azure AI, которую можно использовать при выполнении навыков. |
|
| description |
string |
Описание набора навыков. |
|
| encryptionKey |
Описание ключа шифрования, созданного в Azure Key Vault. Этот ключ используется для обеспечения дополнительного уровня шифрования при хранении для определения набора навыков, когда вы хотите быть полностью уверены в том, что никто, даже корпорация Майкрософт, не сможет расшифровать определение вашего набора навыков. После того как вы зашифровали определение набора навыков, оно всегда будет оставаться зашифрованным. Служба поиска будет игнорировать попытки установить для этого свойства значение null. Вы можете изменить это свойство по мере необходимости, если хотите повернуть ключ шифрования; Определение вашего набора навыков не будет затронуто. Шифрование с помощью ключей, управляемых клиентом, недоступно для бесплатных поисковых служб и доступно только для платных служб, созданных 1 января 2019 г. или позже. |
||
| indexProjections |
Определение дополнительных проекций для индексов вторичного поиска. |
||
| knowledgeStore |
Определение дополнительных проекций обогащенных данных на BLOB-объекты, таблицы или файлы Azure. |
Ответы
| Имя | Тип | Описание |
|---|---|---|
| 200 OK |
Набор навыков успешно обновлен. |
|
| 201 Created |
Набор навыков успешно создан. |
|
| Other Status Codes |
Ответ на ошибку. |
Примеры
SearchServiceCreateOrUpdateSkillset
Образец запроса
PUT https://stableexampleservice.search.windows.net/skillsets('tempskillset')?api-version=2025-09-01
{
"name": "tempskillset",
"description": "Skillset for extracting entities and more",
"skills": [
{
"@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
"name": "skill2",
"inputs": [
{
"name": "text",
"source": "/document/content"
},
{
"name": "countryHint",
"source": "/document/countryHint"
}
],
"outputs": [
{
"name": "languageCode",
"targetName": "languageCode"
}
]
},
{
"textSplitMode": "pages",
"maximumPageLength": 4000,
"@odata.type": "#Microsoft.Skills.Text.SplitSkill",
"name": "skill3",
"inputs": [
{
"name": "text",
"source": "/document/content"
},
{
"name": "languageCode",
"source": "/document/languageCode"
}
],
"outputs": [
{
"name": "textItems",
"targetName": "pages"
}
]
},
{
"@odata.type": "#Microsoft.Skills.Text.KeyPhraseExtractionSkill",
"name": "skill4",
"context": "/document/pages/*",
"inputs": [
{
"name": "text",
"source": "/document/content"
},
{
"name": "languageCode",
"source": "/document/languageCode"
}
],
"outputs": [
{
"name": "keyPhrases",
"targetName": "keyPhrases"
}
]
},
{
"uri": "https://contoso.example.org/",
"httpMethod": "POST",
"timeout": "PT5S",
"@odata.type": "#Microsoft.Skills.Custom.WebApiSkill",
"name": "skill5",
"inputs": [
{
"name": "text",
"source": "/document/content"
},
{
"name": "languageCode",
"source": "/document/languageCode"
}
],
"outputs": [
{
"name": "customresult",
"targetName": "result"
}
]
},
{
"outputMode": "oneToMany",
"markdownHeaderDepth": "h3",
"@odata.type": "#Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill",
"name": "docIntelligenceLayoutSkill",
"context": "/document",
"inputs": [
{
"name": "file_data",
"source": "/document/content"
}
],
"outputs": [
{
"name": "markdown_document",
"targetName": "markdown_document"
}
]
},
{
"outputFormat": "text",
"outputMode": "oneToMany",
"extractionOptions": [
"images",
"locationMetadata"
],
"chunkingProperties": {
"unit": "characters",
"maximumLength": 500,
"overlapLength": 50
},
"@odata.type": "#Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill",
"name": "docIntelligenceLayoutSkill#2",
"context": "/document",
"inputs": [
{
"name": "file_data",
"source": "/document/content"
}
],
"outputs": [
{
"name": "text_sections",
"targetName": "text_sections"
},
{
"name": "normalized_images",
"targetName": "normalized_images"
}
]
}
],
"cognitiveServices": {
"@odata.type": "#Microsoft.Azure.Search.DefaultCognitiveServices",
"description": "Description of the Azure AI service resource attached to a skillset"
},
"@odata.etag": "0x1234568AE7E58A1"
}
Пример ответа
{
"@odata.etag": "0x1234568AE7E58A1",
"name": "tempskillset",
"description": "Skillset for extracting entities and more",
"skills": [
{
"@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
"name": "skill2",
"inputs": [
{
"name": "text",
"source": "/document/content",
"inputs": []
},
{
"name": "countryHint",
"source": "/document/countryHint",
"inputs": []
}
],
"outputs": [
{
"name": "languageCode",
"targetName": "languageCode"
}
]
},
{
"@odata.type": "#Microsoft.Skills.Text.SplitSkill",
"name": "skill3",
"textSplitMode": "pages",
"maximumPageLength": 4000,
"inputs": [
{
"name": "text",
"source": "/document/content",
"inputs": []
},
{
"name": "languageCode",
"source": "/document/languageCode",
"inputs": []
}
],
"outputs": [
{
"name": "textItems",
"targetName": "pages"
}
]
},
{
"@odata.type": "#Microsoft.Skills.Text.KeyPhraseExtractionSkill",
"name": "skill4",
"context": "/document/pages/*",
"inputs": [
{
"name": "text",
"source": "/document/content",
"inputs": []
},
{
"name": "languageCode",
"source": "/document/languageCode",
"inputs": []
}
],
"outputs": [
{
"name": "keyPhrases",
"targetName": "keyPhrases"
}
]
},
{
"@odata.type": "#Microsoft.Skills.Custom.WebApiSkill",
"name": "skill5",
"uri": "https://contoso.example.org/",
"httpMethod": "POST",
"timeout": "PT5S",
"inputs": [
{
"name": "text",
"source": "/document/content",
"inputs": []
},
{
"name": "languageCode",
"source": "/document/languageCode",
"inputs": []
}
],
"outputs": [
{
"name": "customresult",
"targetName": "result"
}
]
},
{
"@odata.type": "#Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill",
"name": "docIntelligenceLayoutSkill",
"context": "/document",
"outputMode": "oneToMany",
"markdownHeaderDepth": "h3",
"extractionOptions": [],
"inputs": [
{
"name": "file_data",
"source": "/document/content",
"inputs": []
}
],
"outputs": [
{
"name": "markdown_document",
"targetName": "markdown_document"
}
]
},
{
"@odata.type": "#Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill",
"name": "docIntelligenceLayoutSkill#2",
"context": "/document",
"outputMode": "oneToMany",
"outputFormat": "text",
"extractionOptions": [
"images",
"locationMetadata"
],
"inputs": [
{
"name": "file_data",
"source": "/document/content",
"inputs": []
}
],
"outputs": [
{
"name": "text_sections",
"targetName": "text_sections"
},
{
"name": "normalized_images",
"targetName": "normalized_images"
}
],
"chunkingProperties": {
"unit": "characters",
"maximumLength": 500,
"overlapLength": 50
}
}
],
"cognitiveServices": {
"@odata.type": "#Microsoft.Azure.Search.DefaultCognitiveServices",
"description": "Description of the Azure AI service resource attached to a skillset"
}
}
{
"@odata.etag": "0x1234568AE7E58A1",
"name": "tempskillset",
"description": "Skillset for extracting entities and more",
"skills": [
{
"@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
"name": "skill2",
"inputs": [
{
"name": "text",
"source": "/document/content",
"inputs": []
},
{
"name": "countryHint",
"source": "/document/countryHint",
"inputs": []
}
],
"outputs": [
{
"name": "languageCode",
"targetName": "languageCode"
}
]
},
{
"@odata.type": "#Microsoft.Skills.Text.SplitSkill",
"name": "skill3",
"textSplitMode": "pages",
"maximumPageLength": 4000,
"inputs": [
{
"name": "text",
"source": "/document/content",
"inputs": []
},
{
"name": "languageCode",
"source": "/document/languageCode",
"inputs": []
}
],
"outputs": [
{
"name": "textItems",
"targetName": "pages"
}
]
},
{
"@odata.type": "#Microsoft.Skills.Text.KeyPhraseExtractionSkill",
"name": "skill4",
"context": "/document/pages/*",
"inputs": [
{
"name": "text",
"source": "/document/content",
"inputs": []
},
{
"name": "languageCode",
"source": "/document/languageCode",
"inputs": []
}
],
"outputs": [
{
"name": "keyPhrases",
"targetName": "keyPhrases"
}
]
},
{
"@odata.type": "#Microsoft.Skills.Custom.WebApiSkill",
"name": "skill5",
"uri": "https://contoso.example.org/",
"httpMethod": "POST",
"timeout": "PT5S",
"inputs": [
{
"name": "text",
"source": "/document/content",
"inputs": []
},
{
"name": "languageCode",
"source": "/document/languageCode",
"inputs": []
}
],
"outputs": [
{
"name": "customresult",
"targetName": "result"
}
]
},
{
"@odata.type": "#Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill",
"name": "docIntelligenceLayoutSkill",
"context": "/document",
"outputMode": "oneToMany",
"markdownHeaderDepth": "h3",
"extractionOptions": [],
"inputs": [
{
"name": "file_data",
"source": "/document/content",
"inputs": []
}
],
"outputs": [
{
"name": "markdown_document",
"targetName": "markdown_document"
}
]
},
{
"@odata.type": "#Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill",
"name": "docIntelligenceLayoutSkill#2",
"context": "/document",
"outputMode": "oneToMany",
"outputFormat": "text",
"extractionOptions": [
"images",
"locationMetadata"
],
"inputs": [
{
"name": "file_data",
"source": "/document/content",
"inputs": []
}
],
"outputs": [
{
"name": "text_sections",
"targetName": "text_sections"
},
{
"name": "normalized_images",
"targetName": "normalized_images"
}
],
"chunkingProperties": {
"unit": "characters",
"maximumLength": 500,
"overlapLength": 50
}
}
],
"cognitiveServices": {
"@odata.type": "#Microsoft.Azure.Search.DefaultCognitiveServices",
"description": "Description of the Azure AI service resource attached to a skillset"
}
}
Определения
| Имя | Описание |
|---|---|
|
Azure |
Учетные данные зарегистрированного приложения, созданного для службы поиска, используемого для доступа с проверкой подлинности к ключам шифрования, хранящимся в Azure Key Vault. |
|
Azure |
Позволяет создать векторное встраивание для заданного текстового ввода с помощью ресурса Azure OpenAI. |
|
Azure |
Имя модели Azure Open AI, которое будет вызываться. |
|
Cognitive |
Ключ учетной записи для нескольких регионов ресурса службы Azure AI, который подключен к набору навыков. |
|
Conditional |
Навык, который позволяет использовать сценарии, требующие логической операции для определения данных, назначаемых выходным данным. |
|
Custom |
Объект, содержащий информацию о найденных совпадениях и связанные метаданные. |
|
Custom |
Сложный объект, который может быть использован для указания альтернативных вариантов написания или синонимов к имени корневой сущности. |
|
Custom |
Навык ищет текст из пользовательского, определенного пользователем списка слов и фраз. |
|
Custom |
Коды языков, поддерживаемые для ввода текста CustomEntityLookupSkill. |
|
Default |
Пустой объект, представляющий ресурс службы Azure AI по умолчанию для набора навыков. |
|
Document |
Навык, который извлекает содержимое из файла в конвейере обогащения. |
|
Document |
Навык, который извлекает информацию о содержимом и макете с помощью служб Azure AI из файлов в конвейере обогащения. |
|
Document |
Управляет кратностью для разбивки содержимого. |
|
Document |
Управляет кратностью единицы блока. По умолчанию — 'characters' |
|
Document |
Управляет кратностью содержимого, извлекаемого из документа с помощью навыка. |
|
Document |
Глубина заголовков в выводе Markdown. Значение по умолчанию — h6. |
|
Document |
Управляет кратностью выходного формата. По умолчанию используется 'markdown'. |
|
Document |
Управляет кратностью выходных данных, созданных навыком. Значение по умолчанию — «oneToMany». |
|
Entity |
Строка, указывающая, какие категории сущностей следует вернуть. |
|
Entity |
С помощью Text Analytics API извлекает связанные сущности из текста. |
|
Entity |
Этот навык устарел. Используйте V3. EntityRecognitionSkill вместо этого. |
|
Entity |
Устарело. Коды языков, поддерживаемые для вводимого текста EntityRecognitionSkill. |
|
Entity |
С помощью Text Analytics API извлекает из текста сущности разных типов. |
|
Error |
Дополнительные сведения об ошибке управления ресурсами. |
|
Error |
Сведения об ошибке. |
|
Error |
Ответ на ошибку |
|
Image |
Навык, который анализирует файлы изображений. Он извлекает богатый набор визуальных функций на основе содержимого изображения. |
|
Image |
Коды языков, поддерживаемые для ввода ImageAnalysisSkill. |
|
Image |
Строка, указывающая, какие сведения, относящиеся к предметной области, следует возвращать. |
|
Index |
Определяет поведение проекций индекса по отношению к остальной части индексатора. |
|
Input |
Сопоставление полей ввода для навыка. |
|
Key |
Навык, использующий текстовую аналитику для извлечения ключевых фраз. |
|
Key |
Коды языков, поддерживаемые для ввода текста KeyPhraseExtractionSkill. |
|
Language |
Навык, который определяет язык вводимого текста и сообщает единый код языка для каждого документа, отправленного по запросу. Код языка сопоставляется с оценкой, указывающей на достоверность анализа. |
|
Line |
Определяет последовательность символов, используемых между строками текста, распознаваемыми навыком OCR. Значение по умолчанию — "space". |
|
Merge |
Навык слияния двух или более строк в одну унифицированную строку с необязательным пользовательским разделителем, разделяющим каждую составную часть. |
|
Ocr |
Навык, который извлекает текст из файлов изображений. |
|
Ocr |
Коды языков, поддерживаемые для ввода OcrSkill. |
|
Output |
Сопоставление выходных полей для навыка. |
|
PIIDetection |
С помощью Text Analytics API извлекается личная информация из входного текста и предоставляется возможность ее маскировки. |
|
PIIDetection |
Строка, указывающая, какой maskingMode следует использовать для маскировки личной информации, обнаруженной во входном тексте. |
|
Search |
Очищает свойство identity источника данных. |
|
Search |
Указывает идентификатор для используемого источника данных. |
|
Search |
Определение дополнительных проекций на индексы вторичного поиска. |
|
Search |
Описание того, какие данные должны храниться в указанном индексе поиска. |
|
Search |
Словарь конфигурационных свойств, специфичных для проекции индекса. Каждое имя — это имя определенного свойства. Каждое значение должно быть примитивного типа. |
|
Search |
Определение дополнительных проекций обогащенных данных на BLOB-объекты, таблицы или файлы Azure. |
|
Search |
Определение проекции для хранения данных в Файлах Azure. |
|
Search |
Определение проекции для хранения данных в большом двоичном объекте Azure. |
|
Search |
Объект-контейнер для различных селекторов проекции. |
|
Search |
Описание данных, которые следует хранить в Azure Tables. |
|
Search |
Список навыков. |
|
Search |
Ключ шифрования, управляемый клиентом, в Azure Key Vault. Ключи, которые вы создаете и которыми управляете, можно использовать для шифрования или расшифровки хранимых данных, таких как индексы и сопоставления синонимов. |
|
Sentiment |
Этот навык устарел. Используйте V3. SentimentSkill вместо этого. |
|
Sentiment |
Устарело. Коды языков, поддерживаемые SentimentSkill для вводимого текста. |
|
Sentiment |
С помощью API анализа текста он оценивает неструктурированный текст и для каждой записи предоставляет метки тональности (например, «отрицательный», «нейтральный» и «положительный») на основе наивысшей оценки достоверности, обнаруженной службой на уровне предложения и документа. |
|
Shaper |
Умение перекраивать выходные данные. Он создает сложный тип для поддержки составных полей (также известных как составные поля). |
|
Split |
Умение разбивать строку на куски текста. |
|
Split |
Коды языков, поддерживаемые SplitSkill для ввода текста. |
|
Text |
Значение, указывающее, какой режим разделения следует выполнить. |
|
Text |
Умение переводить текст с одного языка на другой. |
|
Text |
Коды языков, поддерживаемые TextTranslationSkill для вводимого текста. |
|
Visual |
Строки, указывающие, какие типы визуальных элементов следует возвращать. |
|
Web |
Навык, который может вызывать конечную точку веб-API, позволяя расширить набор навыков, заставив его вызывать ваш пользовательский код. |
AzureActiveDirectoryApplicationCredentials
Учетные данные зарегистрированного приложения, созданного для службы поиска, используемого для доступа с проверкой подлинности к ключам шифрования, хранящимся в Azure Key Vault.
| Имя | Тип | Описание |
|---|---|---|
| applicationId |
string |
Идентификатор приложения AAD, которому предоставлены необходимые разрешения на доступ к Azure Key Vault, который будет использоваться при шифровании неактивных данных. Идентификатор приложения не следует путать с идентификатором объекта для приложения AAD. |
| applicationSecret |
string |
Ключ аутентификации указанного приложения AAD. |
AzureOpenAIEmbeddingSkill
Позволяет создать векторное встраивание для заданного текстового ввода с помощью ресурса Azure OpenAI.
| Имя | Тип | Описание |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Фрагмент URI, указывающий тип навыка. |
| apiKey |
string |
Ключ API указанного ресурса Azure OpenAI. |
| authIdentity | SearchIndexerDataIdentity: |
Назначаемое пользователем управляемое удостоверение, используемое для исходящих подключений. |
| context |
string |
Представляет уровень, на котором выполняются операции, например корневой каталог документа или содержимое документа (например, /document или /document/content). Значение по умолчанию — /document. |
| deploymentId |
string |
Идентификатор развертывания модели Azure OpenAI на указанном ресурсе. |
| description |
string |
Описание навыка, которое описывает входы, выходы и использование навыка. |
| dimensions |
integer (int32) |
Число измерений, в которых должны быть внедренные выходные данные. Поддерживается только в моделях text-embedding-3 и более поздних версий. |
| inputs |
Входными данными навыков может быть столбец в исходном наборе данных или выходные данные вышестоящего навыка. |
|
| modelName |
Имя модели внедрения, которая развертывается по указанному пути deploymentId. |
|
| name |
string |
Название навыка, которое однозначно идентифицирует его в наборе навыков. Навыку, имя которого не определено, будет присвоено по умолчанию в виде индекса из 1 в массиве навыков, начинающегося с префикса '#'. |
| outputs |
Выходными данными навыка является либо поле в индексе поиска, либо значение, которое может быть использовано в качестве входных данных другим навыком. |
|
| resourceUri |
string (uri) |
URI ресурса Azure OpenAI. |
AzureOpenAIModelName
Имя модели Azure Open AI, которое будет вызываться.
| Значение | Описание |
|---|---|
| text-embedding-ada-002 | |
| text-embedding-3-large | |
| text-embedding-3-small |
CognitiveServicesAccountKey
Ключ учетной записи для нескольких регионов ресурса службы Azure AI, который подключен к набору навыков.
| Имя | Тип | Описание |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Фрагмент универсального кода ресурса (URI), указывающий тип ресурса службы Azure AI, подключенного к набору навыков. |
| description |
string |
Описание ресурса службы Azure AI, прикрепленного к набору навыков. |
| key |
string |
Ключ, используемый для подготовки ресурса службы Azure AI, прикрепленного к набору навыков. |
ConditionalSkill
Навык, который позволяет использовать сценарии, требующие логической операции для определения данных, назначаемых выходным данным.
| Имя | Тип | Описание |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Фрагмент URI, указывающий тип навыка. |
| context |
string |
Представляет уровень, на котором выполняются операции, например корневой каталог документа или содержимое документа (например, /document или /document/content). Значение по умолчанию — /document. |
| description |
string |
Описание навыка, которое описывает входы, выходы и использование навыка. |
| inputs |
Входными данными навыков может быть столбец в исходном наборе данных или выходные данные вышестоящего навыка. |
|
| name |
string |
Название навыка, которое однозначно идентифицирует его в наборе навыков. Навыку, имя которого не определено, будет присвоено по умолчанию в виде индекса из 1 в массиве навыков, начинающегося с префикса '#'. |
| outputs |
Выходными данными навыка является либо поле в индексе поиска, либо значение, которое может быть использовано в качестве входных данных другим навыком. |
CustomEntity
Объект, содержащий информацию о найденных совпадениях и связанные метаданные.
| Имя | Тип | Описание |
|---|---|---|
| accentSensitive |
boolean |
По умолчанию false. Логическое значение, указывающее, должно ли сравнение с именем сущности быть чувствительным к диакритическим знакам. |
| aliases |
Массив сложных объектов, которые можно использовать для указания альтернативных вариантов написания или синонимов к имени корневой сущности. |
|
| caseSensitive |
boolean |
По умолчанию false. Логическое значение, указывающее, должно ли сравнение с именем сущности быть чувствительным к регистру символов. Примерами нечувствительных к регистру совпадений "Microsoft" могут быть: microsoft, microSoft, MICROSOFT. |
| defaultAccentSensitive |
boolean |
Изменяет значение чувствительности к диакритическим знакам по умолчанию для этой сущности. Он может использоваться для изменения значения по умолчанию для всех значений псевдонимов accentSensitive. |
| defaultCaseSensitive |
boolean |
Изменяет значение чувствительности регистра по умолчанию для этой сущности. Он может использоваться для изменения значения по умолчанию для всех значений псевдонимов caseSensitive. |
| defaultFuzzyEditDistance |
integer (int32) |
Изменяет значение расстояния нечеткого редактирования по умолчанию для этого объекта. Его можно использовать для изменения значения по умолчанию для всех значений псевдонимов fuzzyEditDistance. |
| description |
string |
Это поле можно использовать в качестве сквозного для пользовательских метаданных о совпадающем тексте. Значение этого поля будет отображаться при каждом совпадении его сущности в выходных данных навыка. |
| fuzzyEditDistance |
integer (int32) |
По умолчанию 0. Максимальное значение 5. Обозначает допустимое количество расходящихся символов, которые все равно будут составлять совпадение с именем сущности. Возвращается минимально возможная нечеткость для любого конкретного совпадения. Например, если расстояние редактирования установлено равным 3, "Windows10" все равно будет соответствовать "Windows", "Windows10" и "Windows 7". Когда чувствительность регистра установлена в false, различия в регистре НЕ учитываются при учете допуска нечеткости, но в противном случае учитываются. |
| id |
string |
Это поле можно использовать в качестве сквозного для пользовательских метаданных о совпадающем тексте. Значение этого поля будет отображаться при каждом совпадении его сущности в выходных данных навыка. |
| name |
string |
Дескриптор сущности верхнего уровня. Матчи в выводе навыка будут сгруппированы по этому имени, и оно должно представлять собой «нормализованную» форму найденного текста. |
| subtype |
string |
Это поле можно использовать в качестве сквозного для пользовательских метаданных о совпадающем тексте. Значение этого поля будет отображаться при каждом совпадении его сущности в выходных данных навыка. |
| type |
string |
Это поле можно использовать в качестве сквозного для пользовательских метаданных о совпадающем тексте. Значение этого поля будет отображаться при каждом совпадении его сущности в выходных данных навыка. |
CustomEntityAlias
Сложный объект, который может быть использован для указания альтернативных вариантов написания или синонимов к имени корневой сущности.
| Имя | Тип | Описание |
|---|---|---|
| accentSensitive |
boolean |
Определите, чувствителен ли псевдоним к диакритическим знакам. |
| caseSensitive |
boolean |
Определите, чувствителен ли регистр в псевдониме. |
| fuzzyEditDistance |
integer (int32) |
Определите нечеткое расстояние редактирования псевдонима. |
| text |
string |
Текст псевдонима. |
CustomEntityLookupSkill
Навык ищет текст из пользовательского, определенного пользователем списка слов и фраз.
| Имя | Тип | Описание |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Фрагмент URI, указывающий тип навыка. |
| context |
string |
Представляет уровень, на котором выполняются операции, например корневой каталог документа или содержимое документа (например, /document или /document/content). Значение по умолчанию — /document. |
| defaultLanguageCode |
Значение, указывающее, какой код языка следует использовать. По умолчанию — |
|
| description |
string |
Описание навыка, которое описывает входы, выходы и использование навыка. |
| entitiesDefinitionUri |
string |
Путь к файлу JSON или CSV, содержащему весь целевой текст для сопоставления. Это определение сущности считывается в начале выполнения индексатора. Любые обновления этого файла во время выполнения индексатора не вступят в силу до последующих запусков. Эта конфигурация должна быть доступна по протоколу HTTPS. |
| globalDefaultAccentSensitive |
boolean |
Глобальный флаг для AccentSensitive. Если AccentSensitive не задан в CustomEntity, это значение будет значением по умолчанию. |
| globalDefaultCaseSensitive |
boolean |
Глобальный флаг для CaseSensitive. Если CaseSensitive не задан в CustomEntity, это значение будет значением по умолчанию. |
| globalDefaultFuzzyEditDistance |
integer (int32) |
Глобальный флаг для FuzzyEditDistance. Если в CustomEntity не задан параметр FuzzyEditDistance, это значение будет значением по умолчанию. |
| inlineEntitiesDefinition |
Встроенное определение CustomEntity. |
|
| inputs |
Входными данными навыков может быть столбец в исходном наборе данных или выходные данные вышестоящего навыка. |
|
| name |
string |
Название навыка, которое однозначно идентифицирует его в наборе навыков. Навыку, имя которого не определено, будет присвоено по умолчанию в виде индекса из 1 в массиве навыков, начинающегося с префикса '#'. |
| outputs |
Выходными данными навыка является либо поле в индексе поиска, либо значение, которое может быть использовано в качестве входных данных другим навыком. |
CustomEntityLookupSkillLanguage
Коды языков, поддерживаемые для ввода текста CustomEntityLookupSkill.
| Значение | Описание |
|---|---|
| da |
Датский |
| de |
German |
| en |
English |
| es |
испанский |
| fi |
Финский |
| fr |
French |
| it |
Italian |
| ko |
Корейский |
| pt |
португальский |
DefaultCognitiveServicesAccount
Пустой объект, представляющий ресурс службы Azure AI по умолчанию для набора навыков.
| Имя | Тип | Описание |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Фрагмент универсального кода ресурса (URI), указывающий тип ресурса службы Azure AI, подключенного к набору навыков. |
| description |
string |
Описание ресурса службы Azure AI, прикрепленного к набору навыков. |
DocumentExtractionSkill
Навык, который извлекает содержимое из файла в конвейере обогащения.
| Имя | Тип | Описание |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Фрагмент URI, указывающий тип навыка. |
| configuration |
object |
Словарь конфигураций для навыка. |
| context |
string |
Представляет уровень, на котором выполняются операции, например корневой каталог документа или содержимое документа (например, /document или /document/content). Значение по умолчанию — /document. |
| dataToExtract |
string |
Тип данных, которые необходимо извлечь для навыка. Будет установлено значение 'contentAndMetadata', если не определено. |
| description |
string |
Описание навыка, которое описывает входы, выходы и использование навыка. |
| inputs |
Входными данными навыков может быть столбец в исходном наборе данных или выходные данные вышестоящего навыка. |
|
| name |
string |
Название навыка, которое однозначно идентифицирует его в наборе навыков. Навыку, имя которого не определено, будет присвоено по умолчанию в виде индекса из 1 в массиве навыков, начинающегося с префикса '#'. |
| outputs |
Выходными данными навыка является либо поле в индексе поиска, либо значение, которое может быть использовано в качестве входных данных другим навыком. |
|
| parsingMode |
string |
parsingMode для навыка. Будет установлено значение 'default', если не определено. |
DocumentIntelligenceLayoutSkill
Навык, который извлекает информацию о содержимом и макете с помощью служб Azure AI из файлов в конвейере обогащения.
| Имя | Тип | Default value | Описание |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Фрагмент URI, указывающий тип навыка. |
|
| chunkingProperties |
Управляет кратностью для разбивки содержимого. |
||
| context |
string |
Представляет уровень, на котором выполняются операции, например корневой каталог документа или содержимое документа (например, /document или /document/content). Значение по умолчанию — /document. |
|
| description |
string |
Описание навыка, которое описывает входы, выходы и использование навыка. |
|
| extractionOptions |
Управление кратностью содержимого, извлекаемого из документа, с помощью навыка |
||
| inputs |
Входными данными навыков может быть столбец в исходном наборе данных или выходные данные вышестоящего навыка. |
||
| markdownHeaderDepth | h6 |
Глубина заголовков в выводе Markdown. Значение по умолчанию — h6. |
|
| name |
string |
Название навыка, которое однозначно идентифицирует его в наборе навыков. Навыку, имя которого не определено, будет присвоено по умолчанию в виде индекса из 1 в массиве навыков, начинающегося с префикса '#'. |
|
| outputFormat | markdown |
Управляет кратностью выходного формата. По умолчанию используется 'markdown'. |
|
| outputMode | oneToMany |
Управляет кратностью выходных данных, созданных навыком. Значение по умолчанию — «oneToMany». |
|
| outputs |
Выходными данными навыка является либо поле в индексе поиска, либо значение, которое может быть использовано в качестве входных данных другим навыком. |
DocumentIntelligenceLayoutSkillChunkingProperties
Управляет кратностью для разбивки содержимого.
| Имя | Тип | Default value | Описание |
|---|---|---|---|
| maximumLength |
integer (int32) |
Максимальная длина блока в символах. Значение по умолчанию — 500. |
|
| overlapLength |
integer (int32) |
Длина перекрытия между двумя фрагментами текста. Значение по умолчанию — 0. |
|
| unit | characters |
Единица измерения блока. |
DocumentIntelligenceLayoutSkillChunkingUnit
Управляет кратностью единицы блока. По умолчанию — 'characters'
| Значение | Описание |
|---|---|
| characters |
Указывает чанк по символам. |
DocumentIntelligenceLayoutSkillExtractionOptions
Управляет кратностью содержимого, извлекаемого из документа с помощью навыка.
| Значение | Описание |
|---|---|
| images |
Укажите, что содержимое изображения должно быть извлечено из документа. |
| locationMetadata |
Укажите, что метаданные местоположения должны быть извлечены из документа. |
DocumentIntelligenceLayoutSkillMarkdownHeaderDepth
Глубина заголовков в выводе Markdown. Значение по умолчанию — h6.
| Значение | Описание |
|---|---|
| h1 |
Уровень заголовка 1. |
| h2 |
Уровень заголовка 2. |
| h3 |
Шапка уровня 3. |
| h4 |
Шапка уровня 4. |
| h5 |
Шапка уровня 5. |
| h6 |
Шапка уровня 6. |
DocumentIntelligenceLayoutSkillOutputFormat
Управляет кратностью выходного формата. По умолчанию используется 'markdown'.
| Значение | Описание |
|---|---|
| text |
Укажите формат вывода в виде текста. |
| markdown |
Укажите формат вывода в виде markdown. |
DocumentIntelligenceLayoutSkillOutputMode
Управляет кратностью выходных данных, созданных навыком. Значение по умолчанию — «oneToMany».
| Значение | Описание |
|---|---|
| oneToMany |
Укажите, что вывод должен быть проанализирован как 'oneToMany'. |
EntityCategory
Строка, указывающая, какие категории сущностей следует вернуть.
| Значение | Описание |
|---|---|
| location |
Сущности, описывающие физическое местоположение. |
| organization |
Сущности, описывающие организацию. |
| person |
Сущности, описывающие человека. |
| quantity |
Сущности, описывающие величину. |
| datetime |
Сущности, описывающие дату и время. |
| url |
Сущности, описывающие URL. |
|
Сущности, описывающие адрес электронной почты. |
EntityLinkingSkill
С помощью Text Analytics API извлекает связанные сущности из текста.
| Имя | Тип | Описание |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Фрагмент URI, указывающий тип навыка. |
| context |
string |
Представляет уровень, на котором выполняются операции, например корневой каталог документа или содержимое документа (например, /document или /document/content). Значение по умолчанию — /document. |
| defaultLanguageCode |
string |
Значение, указывающее, какой код языка следует использовать. По умолчанию — |
| description |
string |
Описание навыка, которое описывает входы, выходы и использование навыка. |
| inputs |
Входными данными навыков может быть столбец в исходном наборе данных или выходные данные вышестоящего навыка. |
|
| minimumPrecision |
number (double) minimum: 0maximum: 1 |
Значение от 0 до 1, которое должно использоваться только для включения сущностей, оценка достоверности которых выше указанного значения. Если не задано (по умолчанию) или явно задано значение null, все сущности будут включены. |
| modelVersion |
string |
Версия модели, используемая при вызове службы анализа текста. По умолчанию будет использоваться последняя доступная версия, если она не указана. Мы рекомендуем вам не указывать это значение без крайней необходимости. |
| name |
string |
Название навыка, которое однозначно идентифицирует его в наборе навыков. Навыку, имя которого не определено, будет присвоено по умолчанию в виде индекса из 1 в массиве навыков, начинающегося с префикса '#'. |
| outputs |
Выходными данными навыка является либо поле в индексе поиска, либо значение, которое может быть использовано в качестве входных данных другим навыком. |
EntityRecognitionSkill
Этот навык устарел. Используйте V3. EntityRecognitionSkill вместо этого.
| Имя | Тип | Описание |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Фрагмент URI, указывающий тип навыка. |
| categories |
Список категорий сущностей, которые необходимо извлечь. |
|
| context |
string |
Представляет уровень, на котором выполняются операции, например корневой каталог документа или содержимое документа (например, /document или /document/content). Значение по умолчанию — /document. |
| defaultLanguageCode |
Значение, указывающее, какой код языка следует использовать. По умолчанию — |
|
| description |
string |
Описание навыка, которое описывает входы, выходы и использование навыка. |
| includeTypelessEntities |
boolean |
Определяет, следует ли включать сущности, которые хорошо известны, но не соответствуют предопределенному типу. Если эта конфигурация не задана (по умолчанию), имеет значение null или false, сущности, которые не соответствуют одному из предопределенных типов, не будут отображаться. |
| inputs |
Входными данными навыков может быть столбец в исходном наборе данных или выходные данные вышестоящего навыка. |
|
| minimumPrecision |
number (double) |
Значение от 0 до 1, которое должно использоваться только для включения сущностей, оценка достоверности которых выше указанного значения. Если не задано (по умолчанию) или явно задано значение null, все сущности будут включены. |
| name |
string |
Название навыка, которое однозначно идентифицирует его в наборе навыков. Навыку, имя которого не определено, будет присвоено по умолчанию в виде индекса из 1 в массиве навыков, начинающегося с префикса '#'. |
| outputs |
Выходными данными навыка является либо поле в индексе поиска, либо значение, которое может быть использовано в качестве входных данных другим навыком. |
EntityRecognitionSkillLanguage
Устарело. Коды языков, поддерживаемые для вводимого текста EntityRecognitionSkill.
| Значение | Описание |
|---|---|
| ar |
Arabic |
| cs |
Чешский |
| zh-Hans |
Китайский, упрощенное письмо |
| zh-Hant |
Chinese-Traditional |
| da |
Датский |
| nl |
Нидерландский |
| en |
English |
| fi |
Финский |
| fr |
French |
| de |
German |
| el |
Греческий |
| hu |
Hungarian |
| it |
Italian |
| ja |
Japanese |
| ko |
Корейский |
| no |
Норвежский (букмаал) |
| pl |
Polish |
| pt-PT |
Португальский (Португалия) |
| pt-BR |
португальский (Бразилия) |
| ru |
Russian |
| es |
испанский |
| sv |
Шведский |
| tr |
Турецкий |
EntityRecognitionSkillV3
С помощью Text Analytics API извлекает из текста сущности разных типов.
| Имя | Тип | Описание |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Фрагмент URI, указывающий тип навыка. |
| categories |
string[] |
Список категорий сущностей, которые необходимо извлечь. |
| context |
string |
Представляет уровень, на котором выполняются операции, например корневой каталог документа или содержимое документа (например, /document или /document/content). Значение по умолчанию — /document. |
| defaultLanguageCode |
string |
Значение, указывающее, какой код языка следует использовать. По умолчанию — |
| description |
string |
Описание навыка, которое описывает входы, выходы и использование навыка. |
| inputs |
Входными данными навыков может быть столбец в исходном наборе данных или выходные данные вышестоящего навыка. |
|
| minimumPrecision |
number (double) minimum: 0maximum: 1 |
Значение от 0 до 1, которое должно использоваться только для включения сущностей, оценка достоверности которых выше указанного значения. Если не задано (по умолчанию) или явно задано значение null, все сущности будут включены. |
| modelVersion |
string |
Версия модели, используемая при вызове API анализа текста. По умолчанию будет использоваться последняя доступная версия, если она не указана. Мы рекомендуем вам не указывать это значение без крайней необходимости. |
| name |
string |
Название навыка, которое однозначно идентифицирует его в наборе навыков. Навыку, имя которого не определено, будет присвоено по умолчанию в виде индекса из 1 в массиве навыков, начинающегося с префикса '#'. |
| outputs |
Выходными данными навыка является либо поле в индексе поиска, либо значение, которое может быть использовано в качестве входных данных другим навыком. |
ErrorAdditionalInfo
Дополнительные сведения об ошибке управления ресурсами.
| Имя | Тип | Описание |
|---|---|---|
| info |
object |
Дополнительная информация. |
| type |
string |
Тип дополнительной информации. |
ErrorDetail
Сведения об ошибке.
| Имя | Тип | Описание |
|---|---|---|
| additionalInfo |
Ошибка дополнительная информация. |
|
| code |
string |
Код ошибки. |
| details |
Сведения об ошибке. |
|
| message |
string |
Сообщение об ошибке. |
| target |
string |
Цель ошибки. |
ErrorResponse
Ответ на ошибку
| Имя | Тип | Описание |
|---|---|---|
| error |
Объект ошибки. |
ImageAnalysisSkill
Навык, который анализирует файлы изображений. Он извлекает богатый набор визуальных функций на основе содержимого изображения.
| Имя | Тип | Описание |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Фрагмент URI, указывающий тип навыка. |
| context |
string |
Представляет уровень, на котором выполняются операции, например корневой каталог документа или содержимое документа (например, /document или /document/content). Значение по умолчанию — /document. |
| defaultLanguageCode |
Значение, указывающее, какой код языка следует использовать. По умолчанию — |
|
| description |
string |
Описание навыка, которое описывает входы, выходы и использование навыка. |
| details |
Строка, указывающая, какие сведения, относящиеся к предметной области, следует возвращать. |
|
| inputs |
Входными данными навыков может быть столбец в исходном наборе данных или выходные данные вышестоящего навыка. |
|
| name |
string |
Название навыка, которое однозначно идентифицирует его в наборе навыков. Навыку, имя которого не определено, будет присвоено по умолчанию в виде индекса из 1 в массиве навыков, начинающегося с префикса '#'. |
| outputs |
Выходными данными навыка является либо поле в индексе поиска, либо значение, которое может быть использовано в качестве входных данных другим навыком. |
|
| visualFeatures |
Список визуальных функций. |
ImageAnalysisSkillLanguage
Коды языков, поддерживаемые для ввода ImageAnalysisSkill.
| Значение | Описание |
|---|---|
| ar |
Arabic |
| az |
Азербайджанский |
| bg |
Болгарский |
| bs |
Боснийский (латиница) |
| ca |
Каталанский |
| cs |
Чешский |
| cy |
Валлийский |
| da |
Датский |
| de |
German |
| el |
Греческий |
| en |
English |
| es |
испанский |
| et |
Эстонский |
| eu |
Basque |
| fi |
Финский |
| fr |
French |
| ga |
Ирландский |
| gl |
Галисийский |
| he |
Иврит |
| hi |
Хинди |
| hr |
Croatian |
| hu |
Hungarian |
| id |
Indonesian |
| it |
Italian |
| ja |
Japanese |
| kk |
Казахский |
| ko |
Корейский |
| lt |
Литовский |
| lv |
Латышский |
| mk |
Македонец |
| ms |
Малайский (Малайзия) |
| nb |
Норвежский (букмол) |
| nl |
Нидерландский |
| pl |
Polish |
| prs |
Дари |
| pt-BR |
Португальский (Бразилия) |
| pt |
Португальский (Португалия) |
| pt-PT |
Португальский (Португалия) |
| ro |
Румынский |
| ru |
Russian |
| sk |
Словацкий |
| sl |
Словенский |
| sr-Cyrl |
Сербский — кириллица RS |
| sr-Latn |
Сербский язык — латинский алфавит RS |
| sv |
Шведский |
| th |
Тайский |
| tr |
Турецкий |
| uk |
Ukrainian |
| vi |
Вьетнамский |
| zh |
китайский (упрощенный) |
| zh-Hans |
китайский (упрощенный) |
| zh-Hant |
китайский (традиционный) |
ImageDetail
Строка, указывающая, какие сведения, относящиеся к предметной области, следует возвращать.
| Значение | Описание |
|---|---|
| celebrities |
Детали признаны знаменитостями. |
| landmarks |
Детали признаны достопримечательностями. |
IndexProjectionMode
Определяет поведение проекций индекса по отношению к остальной части индексатора.
| Значение | Описание |
|---|---|
| skipIndexingParentDocuments |
Исходный документ будет пропущен для записи в целевой индекс индексатора. |
| includeIndexingParentDocuments |
Исходный документ будет записан в целевой индекс индексатора. Это шаблон по умолчанию. |
InputFieldMappingEntry
Сопоставление полей ввода для навыка.
| Имя | Тип | Описание |
|---|---|---|
| inputs |
Рекурсивные входные данные, используемые при создании сложного типа. |
|
| name |
string |
Имя входных данных. |
| source |
string |
Источник входных данных. |
| sourceContext |
string |
Исходный контекст, используемый для выбора рекурсивных входных данных. |
KeyPhraseExtractionSkill
Навык, использующий текстовую аналитику для извлечения ключевых фраз.
| Имя | Тип | Описание |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Фрагмент URI, указывающий тип навыка. |
| context |
string |
Представляет уровень, на котором выполняются операции, например корневой каталог документа или содержимое документа (например, /document или /document/content). Значение по умолчанию — /document. |
| defaultLanguageCode |
Значение, указывающее, какой код языка следует использовать. По умолчанию — |
|
| description |
string |
Описание навыка, которое описывает входы, выходы и использование навыка. |
| inputs |
Входными данными навыков может быть столбец в исходном наборе данных или выходные данные вышестоящего навыка. |
|
| maxKeyPhraseCount |
integer (int32) |
Число, указывающее, сколько ключевых фраз нужно вернуть. Если они отсутствуют, будут возвращены все идентифицированные ключевые фразы. |
| modelVersion |
string |
Версия модели, используемая при вызове службы анализа текста. По умолчанию будет использоваться последняя доступная версия, если она не указана. Мы рекомендуем вам не указывать это значение без крайней необходимости. |
| name |
string |
Название навыка, которое однозначно идентифицирует его в наборе навыков. Навыку, имя которого не определено, будет присвоено по умолчанию в виде индекса из 1 в массиве навыков, начинающегося с префикса '#'. |
| outputs |
Выходными данными навыка является либо поле в индексе поиска, либо значение, которое может быть использовано в качестве входных данных другим навыком. |
KeyPhraseExtractionSkillLanguage
Коды языков, поддерживаемые для ввода текста KeyPhraseExtractionSkill.
| Значение | Описание |
|---|---|
| da |
Датский |
| nl |
Нидерландский |
| en |
English |
| fi |
Финский |
| fr |
French |
| de |
German |
| it |
Italian |
| ja |
Japanese |
| ko |
Корейский |
| no |
Норвежский (букмаал) |
| pl |
Polish |
| pt-PT |
Португальский (Португалия) |
| pt-BR |
португальский (Бразилия) |
| ru |
Russian |
| es |
испанский |
| sv |
Шведский |
LanguageDetectionSkill
Навык, который определяет язык вводимого текста и сообщает единый код языка для каждого документа, отправленного по запросу. Код языка сопоставляется с оценкой, указывающей на достоверность анализа.
| Имя | Тип | Описание |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Фрагмент URI, указывающий тип навыка. |
| context |
string |
Представляет уровень, на котором выполняются операции, например корневой каталог документа или содержимое документа (например, /document или /document/content). Значение по умолчанию — /document. |
| defaultCountryHint |
string |
Код страны, который будет использоваться в качестве подсказки для модели определения языка, если она не может устранить неоднозначность языка. |
| description |
string |
Описание навыка, которое описывает входы, выходы и использование навыка. |
| inputs |
Входными данными навыков может быть столбец в исходном наборе данных или выходные данные вышестоящего навыка. |
|
| modelVersion |
string |
Версия модели, используемая при вызове службы анализа текста. По умолчанию будет использоваться последняя доступная версия, если она не указана. Мы рекомендуем вам не указывать это значение без крайней необходимости. |
| name |
string |
Название навыка, которое однозначно идентифицирует его в наборе навыков. Навыку, имя которого не определено, будет присвоено по умолчанию в виде индекса из 1 в массиве навыков, начинающегося с префикса '#'. |
| outputs |
Выходными данными навыка является либо поле в индексе поиска, либо значение, которое может быть использовано в качестве входных данных другим навыком. |
LineEnding
Определяет последовательность символов, используемых между строками текста, распознаваемыми навыком OCR. Значение по умолчанию — "space".
| Значение | Описание |
|---|---|
| space |
Строки разделяются одним пробелом. |
| carriageReturn |
Строки разделяются символом возврата каретки ('\r'). |
| lineFeed |
Строки разделяются одним символом перевода строки ('\n'). |
| carriageReturnLineFeed |
Строки разделяются символом возврата каретки и символом перевода строки ('\r\n'). |
MergeSkill
Навык слияния двух или более строк в одну унифицированную строку с необязательным пользовательским разделителем, разделяющим каждую составную часть.
| Имя | Тип | Default value | Описание |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Фрагмент URI, указывающий тип навыка. |
|
| context |
string |
Представляет уровень, на котором выполняются операции, например корневой каталог документа или содержимое документа (например, /document или /document/content). Значение по умолчанию — /document. |
|
| description |
string |
Описание навыка, которое описывает входы, выходы и использование навыка. |
|
| inputs |
Входными данными навыков может быть столбец в исходном наборе данных или выходные данные вышестоящего навыка. |
||
| insertPostTag |
string |
Тег указывает на конец объединенного текста. По умолчанию тег является пустым местом. |
|
| insertPreTag |
string |
Тег указывает на начало объединенного текста. По умолчанию тег является пустым местом. |
|
| name |
string |
Название навыка, которое однозначно идентифицирует его в наборе навыков. Навыку, имя которого не определено, будет присвоено по умолчанию в виде индекса из 1 в массиве навыков, начинающегося с префикса '#'. |
|
| outputs |
Выходными данными навыка является либо поле в индексе поиска, либо значение, которое может быть использовано в качестве входных данных другим навыком. |
OcrSkill
Навык, который извлекает текст из файлов изображений.
| Имя | Тип | Default value | Описание |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Фрагмент URI, указывающий тип навыка. |
|
| context |
string |
Представляет уровень, на котором выполняются операции, например корневой каталог документа или содержимое документа (например, /document или /document/content). Значение по умолчанию — /document. |
|
| defaultLanguageCode |
Значение, указывающее, какой код языка следует использовать. По умолчанию — |
||
| description |
string |
Описание навыка, которое описывает входы, выходы и использование навыка. |
|
| detectOrientation |
boolean |
False |
Значение, указывающее на включение или отключение определения ориентации. По умолчанию — false. |
| inputs |
Входными данными навыков может быть столбец в исходном наборе данных или выходные данные вышестоящего навыка. |
||
| lineEnding |
Определяет последовательность символов, используемых между строками текста, распознаваемыми навыком OCR. Значение по умолчанию — "space". |
||
| name |
string |
Название навыка, которое однозначно идентифицирует его в наборе навыков. Навыку, имя которого не определено, будет присвоено по умолчанию в виде индекса из 1 в массиве навыков, начинающегося с префикса '#'. |
|
| outputs |
Выходными данными навыка является либо поле в индексе поиска, либо значение, которое может быть использовано в качестве входных данных другим навыком. |
OcrSkillLanguage
Коды языков, поддерживаемые для ввода OcrSkill.
| Значение | Описание |
|---|---|
| af |
Африкаанс |
| sq |
Албанский |
| anp |
Ангика (Деванагири) |
| ar |
Arabic |
| ast |
Астурийский |
| awa |
Авадхи хинди (Деванагири) |
| az |
Азербайджанская (латиница) |
| bfy |
Багхели |
| eu |
Basque |
| be |
Белорусский (кириллица и латиница) |
| be-cyrl |
Белорусский (кириллица) |
| be-latn |
Белорусский (латиница) |
| bho |
Бходжпури хинди (Деванагири) |
| bi |
Бислама |
| brx |
Бодо (Деванагири) |
| bs |
Боснийский (латиница) |
| bra |
Браджбха |
| br |
Бретонский язык |
| bg |
Болгарский |
| bns |
Бундели |
| bua |
Бурятский (кириллица) |
| ca |
Каталанский |
| ceb |
Себуано |
| rab |
Чамлинг |
| ch |
Чаморро |
| hne |
Чхаттисгархи (Деванагири) |
| zh-Hans |
китайский (упрощенный) |
| zh-Hant |
китайский (традиционный) |
| kw |
Корнский язык |
| co |
Корсиканский |
| crh |
Крымско-татарский (латиница) |
| hr |
Croatian |
| cs |
Чешский |
| da |
Датский |
| prs |
Дари |
| dhi |
Дхимал (Деванагири) |
| doi |
Догри (Деванагири) |
| nl |
Нидерландский |
| en |
English |
| myv |
Ерзянский (кириллица) |
| et |
Эстонский |
| fo |
Фарерский |
| fj |
Фиджи |
| fil |
Филиппинский |
| fi |
Финский |
| fr |
French |
| fur |
Фрульский |
| gag |
Гагаузский (латиница) |
| gl |
Галисийский |
| de |
German |
| gil |
Гилбертийский |
| gon |
Гонди (Деванагири) |
| el |
Греческий |
| kl |
Гренландский |
| gvr |
Гурунг (Деванагири) |
| ht |
Гаитянский креольский |
| hlb |
Халби (Деванагири) |
| hni |
Хани |
| bgc |
Харьянви |
| haw |
Гавайская |
| hi |
Хинди |
| mww |
Хмонг Дав (латинский алфавит) |
| hoc |
Хо (Деванагири) |
| hu |
Hungarian |
| is |
Исландский |
| smn |
инари саамский |
| id |
Indonesian |
| ia |
Интерлингва |
| iu |
Inuktitut (латиница) |
| ga |
Ирландский |
| it |
Italian |
| ja |
Japanese |
| Jns |
Жаунсари (Деванагири) |
| jv |
Яванский |
| kea |
Кабувердьяну |
| kac |
Качин (латиница) |
| xnr |
Кангри (Деванагири) |
| krc |
Карачаево-балкарский |
| kaa-cyrl |
Каракалпакский (кириллица) |
| kaa |
Каракалпакский язык (латинская письменность) |
| csb |
Кашубский |
| kk-cyrl |
Казахский (кириллица) |
| kk-latn |
Казахский (латиница) |
| klr |
Халинг |
| kha |
Кхаси |
| quc |
K'iche' |
| ko |
Корейский |
| kfq |
Страх |
| kpy |
Коряк |
| kos |
Косраийский |
| kum |
Кумыкский (кириллица) |
| ku-arab |
Курдский (арабский) |
| ku-latn |
Курдский (латиница) |
| kru |
Курух (Деванагири) |
| ky |
Киргизский (кириллица) |
| lkt |
Лакота |
| la |
Латинская |
| lt |
Литовский |
| dsb |
Нижнелужицкий |
| smj |
Луле-саамский |
| lb |
Люксембургский |
| bfz |
Махасу пахари (Деванагири) |
| ms |
Малайский (латиница) |
| mt |
Мальтийский |
| kmj |
Малто (Деванагири) |
| gv |
Мэнский |
| mi |
Маори |
| mr |
Маратхи |
| mn |
Монгольский (кириллица) |
| cnr-cyrl |
Черногорский (кириллица) |
| cnr-latn |
Черногорский (латиница) |
| nap |
Неаполитанский |
| ne |
Непальский |
| niu |
Ниуанский |
| nog |
Ногайский |
| sme |
Северносаамский (латиница) |
| nb |
Норвежский |
| no |
Норвежский |
| oc |
Окситанский |
| os |
Осетинский |
| ps |
Пушту |
| fa |
Персидский |
| pl |
Polish |
| pt |
португальский |
| pa |
Пенджаби (арабский) |
| ksh |
Рипуарский диалект |
| ro |
Румынский |
| rm |
Ретороманский |
| ru |
Russian |
| sck |
Садри (Деванагири) |
| sm |
Самоанский (латиница) |
| sa |
Санскрит (Деванагири) |
| sat |
Сантали (Деванагири) |
| sco |
Шотландский язык (Scots) |
| gd |
Шотландский гэльский |
| sr |
Сербский (латиница) |
| sr-Cyrl |
Сербский (кириллица) |
| sr-Latn |
Сербский (латиница) |
| xsr |
Шерпа (Деванагири) |
| srx |
Сирмаури (Деванагири) |
| sms |
Колтта-саамский |
| sk |
Словацкий |
| sl |
Словенский |
| so |
Сомали (арабское письмо) |
| sma |
Южносаамский |
| es |
испанский |
| sw |
Суахили (латиница) |
| sv |
Шведский |
| tg |
Таджикский (кириллица) |
| tt |
Татарский (латиница) |
| tet |
Тетум |
| thf |
Тхангми |
| to |
Тонганский |
| tr |
Турецкий |
| tk |
Туркменский (латиница) |
| tyv |
Тувинский |
| hsb |
Верхнелужицкий |
| ur |
Урду |
| ug |
Уйгурский (арабское письмо) |
| uz-arab |
Узбекский (арабское письмо) |
| uz-cyrl |
Узбекский (кириллица) |
| uz |
Узбекский (латиница) |
| vo |
Волапюк |
| wae |
Вальзер |
| cy |
Валлийский |
| fy |
Западнофризский |
| yua |
Юкатекский майя |
| za |
Чжуан |
| zu |
зулу |
| unk |
Неизвестно (Все) |
OutputFieldMappingEntry
Сопоставление выходных полей для навыка.
| Имя | Тип | Описание |
|---|---|---|
| name |
string |
Имя выходных данных, определяемое навыком. |
| targetName |
string |
Целевое имя выходных данных. Он является необязательным и по умолчанию является именем. |
PIIDetectionSkill
С помощью Text Analytics API извлекается личная информация из входного текста и предоставляется возможность ее маскировки.
| Имя | Тип | Описание |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Фрагмент URI, указывающий тип навыка. |
| context |
string |
Представляет уровень, на котором выполняются операции, например корневой каталог документа или содержимое документа (например, /document или /document/content). Значение по умолчанию — /document. |
| defaultLanguageCode |
string |
Значение, указывающее, какой код языка следует использовать. По умолчанию — |
| description |
string |
Описание навыка, которое описывает входы, выходы и использование навыка. |
| domain |
string |
Если указано, домен PII будет включать только подмножество категорий сущностей. Возможные значения: 'phi', 'none'. Значение по умолчанию — 'none'. |
| inputs |
Входными данными навыков может быть столбец в исходном наборе данных или выходные данные вышестоящего навыка. |
|
| maskingCharacter |
string maxLength: 1 |
Символ, используемый для маскировки текста, если для параметра maskingMode задано значение replace. По умолчанию установлено значение '*'. |
| maskingMode |
Параметр, предоставляющий различные способы маскировки личной информации, обнаруженной во входном тексте. Значение по умолчанию — 'none'. |
|
| minimumPrecision |
number (double) minimum: 0maximum: 1 |
Значение от 0 до 1, которое должно использоваться только для включения сущностей, оценка достоверности которых выше указанного значения. Если не задано (по умолчанию) или явно задано значение null, все сущности будут включены. |
| modelVersion |
string |
Версия модели, используемая при вызове службы анализа текста. По умолчанию будет использоваться последняя доступная версия, если она не указана. Мы рекомендуем вам не указывать это значение без крайней необходимости. |
| name |
string |
Название навыка, которое однозначно идентифицирует его в наборе навыков. Навыку, имя которого не определено, будет присвоено по умолчанию в виде индекса из 1 в массиве навыков, начинающегося с префикса '#'. |
| outputs |
Выходными данными навыка является либо поле в индексе поиска, либо значение, которое может быть использовано в качестве входных данных другим навыком. |
|
| piiCategories |
string[] |
Список категорий сущностей PII, которые необходимо извлечь и замаскировать. |
PIIDetectionSkillMaskingMode
Строка, указывающая, какой maskingMode следует использовать для маскировки личной информации, обнаруженной во входном тексте.
| Значение | Описание |
|---|---|
| none |
Маскирование не происходит, и вывод maskedText не будет возвращен. |
| replace |
Заменяет обнаруженные сущности на символ, указанный в параметре maskingCharacter. Символ будет повторяться до длины обнаруженной сущности, чтобы смещения корректно соответствовали как входному тексту, так и выходному maskedText. |
SearchIndexerDataNoneIdentity
Очищает свойство identity источника данных.
| Имя | Тип | Описание |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Фрагмент URI, указывающий тип удостоверения. |
SearchIndexerDataUserAssignedIdentity
Указывает идентификатор для используемого источника данных.
| Имя | Тип | Описание |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Фрагмент URI, указывающий тип удостоверения. |
| userAssignedIdentity |
string |
Полный идентификатор ресурса Azure управляемого удостоверения, назначенного пользователем, обычно в форме "/subscriptions/12345678-1234-1234-123467890ab/resourceGroups/rg/providers/Microsoft.ManagedIdentity/userAssignedIdentities/myId", который должен быть назначен службе поиска. |
SearchIndexerIndexProjections
Определение дополнительных проекций на индексы вторичного поиска.
| Имя | Тип | Описание |
|---|---|---|
| parameters |
Словарь конфигурационных свойств, специфичных для проекции индекса. Каждое имя — это имя определенного свойства. Каждое значение должно быть примитивного типа. |
|
| selectors |
Список проекций, которые должны быть выполнены для индексов вторичного поиска. |
SearchIndexerIndexProjectionSelector
Описание того, какие данные должны храниться в указанном индексе поиска.
| Имя | Тип | Описание |
|---|---|---|
| mappings |
Сопоставления для проекции, или какой источник должен быть сопоставлен с каким полем в целевом индексе. |
|
| parentKeyFieldName |
string |
Имя поля в индексе поиска, с которым сопоставляется значение ключа родительского документа. Должно быть строковым полем, которое можно фильтровать, а не ключевым полем. |
| sourceContext |
string |
Исходный контекст для проекций. Представляет кратность, при которой документ будет разделен на несколько вложенных документов. |
| targetIndexName |
string |
Имя поискового индекса для проекта. Должен иметь ключевое поле с набором анализатора keyword. |
SearchIndexerIndexProjectionsParameters
Словарь конфигурационных свойств, специфичных для проекции индекса. Каждое имя — это имя определенного свойства. Каждое значение должно быть примитивного типа.
| Имя | Тип | Описание |
|---|---|---|
| projectionMode |
Определяет поведение проекций индекса по отношению к остальной части индексатора. |
SearchIndexerKnowledgeStore
Определение дополнительных проекций обогащенных данных на BLOB-объекты, таблицы или файлы Azure.
| Имя | Тип | Описание |
|---|---|---|
| projections |
Список дополнительных проекций, выполняемых во время индексирования. |
|
| storageConnectionString |
string |
Строка подключения к проекциям учетной записи хранения будет храниться в папке. |
SearchIndexerKnowledgeStoreFileProjectionSelector
Определение проекции для хранения данных в Файлах Azure.
| Имя | Тип | Описание |
|---|---|---|
| generatedKeyName |
string |
Имя сгенерированного ключа для хранения проекции. |
| inputs |
Вложенные входные данные для сложных проекций. |
|
| referenceKeyName |
string |
Имя ключа ссылки на другую проекцию. |
| source |
string |
Исходные данные для проекта. |
| sourceContext |
string |
Исходный контекст для сложных проекций. |
| storageContainer |
string |
Контейнер BLOB-объектов для хранения проекций. |
SearchIndexerKnowledgeStoreObjectProjectionSelector
Определение проекции для хранения данных в большом двоичном объекте Azure.
| Имя | Тип | Описание |
|---|---|---|
| generatedKeyName |
string |
Имя сгенерированного ключа для хранения проекции. |
| inputs |
Вложенные входные данные для сложных проекций. |
|
| referenceKeyName |
string |
Имя ключа ссылки на другую проекцию. |
| source |
string |
Исходные данные для проекта. |
| sourceContext |
string |
Исходный контекст для сложных проекций. |
| storageContainer |
string |
Контейнер BLOB-объектов для хранения проекций. |
SearchIndexerKnowledgeStoreProjection
Объект-контейнер для различных селекторов проекции.
| Имя | Тип | Описание |
|---|---|---|
| files |
Проекции в хранилище файлов Azure. |
|
| objects |
Проекции в хранилище BLOB-объектов Azure. |
|
| tables |
Проекции в хранилище таблиц Azure. |
SearchIndexerKnowledgeStoreTableProjectionSelector
Описание данных, которые следует хранить в Azure Tables.
| Имя | Тип | Описание |
|---|---|---|
| generatedKeyName |
string |
Имя сгенерированного ключа для хранения проекции. |
| inputs |
Вложенные входные данные для сложных проекций. |
|
| referenceKeyName |
string |
Имя ключа ссылки на другую проекцию. |
| source |
string |
Исходные данные для проекта. |
| sourceContext |
string |
Исходный контекст для сложных проекций. |
| tableName |
string |
Имя таблицы Azure, в которой будут храниться спроецированные данные. |
SearchIndexerSkillset
Список навыков.
| Имя | Тип | Описание |
|---|---|---|
| @odata.etag |
string |
ETag набора навыков. |
| cognitiveServices | CognitiveServicesAccount: |
Подробные сведения о службе Azure AI, которую можно использовать при выполнении навыков. |
| description |
string |
Описание набора навыков. |
| encryptionKey |
Описание ключа шифрования, созданного в Azure Key Vault. Этот ключ используется для обеспечения дополнительного уровня шифрования при хранении для определения набора навыков, когда вы хотите быть полностью уверены в том, что никто, даже корпорация Майкрософт, не сможет расшифровать определение вашего набора навыков. После того как вы зашифровали определение набора навыков, оно всегда будет оставаться зашифрованным. Служба поиска будет игнорировать попытки установить для этого свойства значение null. Вы можете изменить это свойство по мере необходимости, если хотите повернуть ключ шифрования; Определение вашего набора навыков не будет затронуто. Шифрование с помощью ключей, управляемых клиентом, недоступно для бесплатных поисковых служб и доступно только для платных служб, созданных 1 января 2019 г. или позже. |
|
| indexProjections |
Определение дополнительных проекций для индексов вторичного поиска. |
|
| knowledgeStore |
Определение дополнительных проекций обогащенных данных на BLOB-объекты, таблицы или файлы Azure. |
|
| name |
string |
Название набора навыков. |
| skills |
SearchIndexerSkill[]:
|
Список навыков в наборе навыков. |
SearchResourceEncryptionKey
Ключ шифрования, управляемый клиентом, в Azure Key Vault. Ключи, которые вы создаете и которыми управляете, можно использовать для шифрования или расшифровки хранимых данных, таких как индексы и сопоставления синонимов.
| Имя | Тип | Описание |
|---|---|---|
| accessCredentials |
Необязательные учетные данные Azure Active Directory, используемые для доступа к Azure Key Vault. Не требуется, если вместо этого используется управляемое удостоверение. |
|
| keyVaultKeyName |
string |
Имя ключа Azure Key Vault, который будет использоваться для шифрования неактивных данных. |
| keyVaultKeyVersion |
string |
Версия ключа Azure Key Vault, который будет использоваться для шифрования неактивных данных. |
| keyVaultUri |
string |
URI Azure Key Vault, также называемый DNS-именем, который содержит ключ, используемый для шифрования неактивных данных. Примером URI может быть . |
SentimentSkill
Этот навык устарел. Используйте V3. SentimentSkill вместо этого.
| Имя | Тип | Описание |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Фрагмент URI, указывающий тип навыка. |
| context |
string |
Представляет уровень, на котором выполняются операции, например корневой каталог документа или содержимое документа (например, /document или /document/content). Значение по умолчанию — /document. |
| defaultLanguageCode |
Значение, указывающее, какой код языка следует использовать. По умолчанию — |
|
| description |
string |
Описание навыка, которое описывает входы, выходы и использование навыка. |
| inputs |
Входными данными навыков может быть столбец в исходном наборе данных или выходные данные вышестоящего навыка. |
|
| name |
string |
Название навыка, которое однозначно идентифицирует его в наборе навыков. Навыку, имя которого не определено, будет присвоено по умолчанию в виде индекса из 1 в массиве навыков, начинающегося с префикса '#'. |
| outputs |
Выходными данными навыка является либо поле в индексе поиска, либо значение, которое может быть использовано в качестве входных данных другим навыком. |
SentimentSkillLanguage
Устарело. Коды языков, поддерживаемые SentimentSkill для вводимого текста.
| Значение | Описание |
|---|---|
| da |
Датский |
| nl |
Нидерландский |
| en |
English |
| fi |
Финский |
| fr |
French |
| de |
German |
| el |
Греческий |
| it |
Italian |
| no |
Норвежский (букмаал) |
| pl |
Polish |
| pt-PT |
Португальский (Португалия) |
| ru |
Russian |
| es |
испанский |
| sv |
Шведский |
| tr |
Турецкий |
SentimentSkillV3
С помощью API анализа текста он оценивает неструктурированный текст и для каждой записи предоставляет метки тональности (например, «отрицательный», «нейтральный» и «положительный») на основе наивысшей оценки достоверности, обнаруженной службой на уровне предложения и документа.
| Имя | Тип | Default value | Описание |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Фрагмент URI, указывающий тип навыка. |
|
| context |
string |
Представляет уровень, на котором выполняются операции, например корневой каталог документа или содержимое документа (например, /document или /document/content). Значение по умолчанию — /document. |
|
| defaultLanguageCode |
string |
Значение, указывающее, какой код языка следует использовать. По умолчанию — |
|
| description |
string |
Описание навыка, которое описывает входы, выходы и использование навыка. |
|
| includeOpinionMining |
boolean |
False |
Если задано значение true, выходные данные навыка будут включать информацию из Text Analytics для интеллектуального анализа мнений, а именно цели (существительные или глаголы) и связанную с ними оценку (прилагательное) в тексте. По умолчанию — false. |
| inputs |
Входными данными навыков может быть столбец в исходном наборе данных или выходные данные вышестоящего навыка. |
||
| modelVersion |
string |
Версия модели, используемая при вызове службы анализа текста. По умолчанию будет использоваться последняя доступная версия, если она не указана. Мы рекомендуем вам не указывать это значение без крайней необходимости. |
|
| name |
string |
Название навыка, которое однозначно идентифицирует его в наборе навыков. Навыку, имя которого не определено, будет присвоено по умолчанию в виде индекса из 1 в массиве навыков, начинающегося с префикса '#'. |
|
| outputs |
Выходными данными навыка является либо поле в индексе поиска, либо значение, которое может быть использовано в качестве входных данных другим навыком. |
ShaperSkill
Умение перекраивать выходные данные. Он создает сложный тип для поддержки составных полей (также известных как составные поля).
| Имя | Тип | Описание |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Фрагмент URI, указывающий тип навыка. |
| context |
string |
Представляет уровень, на котором выполняются операции, например корневой каталог документа или содержимое документа (например, /document или /document/content). Значение по умолчанию — /document. |
| description |
string |
Описание навыка, которое описывает входы, выходы и использование навыка. |
| inputs |
Входными данными навыков может быть столбец в исходном наборе данных или выходные данные вышестоящего навыка. |
|
| name |
string |
Название навыка, которое однозначно идентифицирует его в наборе навыков. Навыку, имя которого не определено, будет присвоено по умолчанию в виде индекса из 1 в массиве навыков, начинающегося с префикса '#'. |
| outputs |
Выходными данными навыка является либо поле в индексе поиска, либо значение, которое может быть использовано в качестве входных данных другим навыком. |
SplitSkill
Умение разбивать строку на куски текста.
| Имя | Тип | Описание |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Фрагмент URI, указывающий тип навыка. |
| context |
string |
Представляет уровень, на котором выполняются операции, например корневой каталог документа или содержимое документа (например, /document или /document/content). Значение по умолчанию — /document. |
| defaultLanguageCode |
Значение, указывающее, какой код языка следует использовать. По умолчанию — |
|
| description |
string |
Описание навыка, которое описывает входы, выходы и использование навыка. |
| inputs |
Входными данными навыков может быть столбец в исходном наборе данных или выходные данные вышестоящего навыка. |
|
| maximumPageLength |
integer (int32) |
Желаемая максимальная длина страницы. По умолчанию 10000. |
| maximumPagesToTake |
integer (int32) |
Применимо только в том случае, если для параметра textSplitMode установлено значение 'pages'. Если указано, SplitSkill прекратит разделение после обработки первых страниц 'maximumPagesToTake', чтобы повысить производительность, когда требуется всего несколько начальных страниц из каждого документа. |
| name |
string |
Название навыка, которое однозначно идентифицирует его в наборе навыков. Навыку, имя которого не определено, будет присвоено по умолчанию в виде индекса из 1 в массиве навыков, начинающегося с префикса '#'. |
| outputs |
Выходными данными навыка является либо поле в индексе поиска, либо значение, которое может быть использовано в качестве входных данных другим навыком. |
|
| pageOverlapLength |
integer (int32) |
Применимо только в том случае, если для параметра textSplitMode установлено значение 'pages'. Если указано, n+1-й чанк будет начинаться с этим количеством символов/токенов с конца n-го чанка. |
| textSplitMode |
Значение, указывающее, какой режим разделения следует выполнить. |
SplitSkillLanguage
Коды языков, поддерживаемые SplitSkill для ввода текста.
| Значение | Описание |
|---|---|
| am |
Амхарский |
| bs |
Боснийский |
| cs |
Чешский |
| da |
Датский |
| de |
German |
| en |
English |
| es |
испанский |
| et |
Эстонский |
| fi |
Финский |
| fr |
French |
| he |
Иврит |
| hi |
Хинди |
| hr |
Croatian |
| hu |
Hungarian |
| id |
Indonesian |
| is |
Исландский |
| it |
Italian |
| ja |
Japanese |
| ko |
Корейский |
| lv |
Латышский |
| nb |
Норвежский |
| nl |
Нидерландский |
| pl |
Polish |
| pt |
Португальский (Португалия) |
| pt-br |
португальский (Бразилия) |
| ru |
Russian |
| sk |
Словацкий |
| sl |
Словенский |
| sr |
Сербский |
| sv |
Шведский |
| tr |
Турецкий |
| ur |
Урду |
| zh |
Китайский (упрощённый) |
TextSplitMode
Значение, указывающее, какой режим разделения следует выполнить.
| Значение | Описание |
|---|---|
| pages |
Разбейте текст на отдельные страницы. |
| sentences |
Разбейте текст на отдельные предложения. |
TextTranslationSkill
Умение переводить текст с одного языка на другой.
| Имя | Тип | Описание |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Фрагмент URI, указывающий тип навыка. |
| context |
string |
Представляет уровень, на котором выполняются операции, например корневой каталог документа или содержимое документа (например, /document или /document/content). Значение по умолчанию — /document. |
| defaultFromLanguageCode |
Код языка для перевода документов для документов, в которых явно не указан исходный язык. |
|
| defaultToLanguageCode |
Код языка для перевода документов для документов, в которых язык не указан явно. |
|
| description |
string |
Описание навыка, которое описывает входы, выходы и использование навыка. |
| inputs |
Входными данными навыков может быть столбец в исходном наборе данных или выходные данные вышестоящего навыка. |
|
| name |
string |
Название навыка, которое однозначно идентифицирует его в наборе навыков. Навыку, имя которого не определено, будет присвоено по умолчанию в виде индекса из 1 в массиве навыков, начинающегося с префикса '#'. |
| outputs |
Выходными данными навыка является либо поле в индексе поиска, либо значение, которое может быть использовано в качестве входных данных другим навыком. |
|
| suggestedFrom |
Код языка для перевода документов, если ни входные данные fromLanguageCode, ни параметр defaultFromLanguageCode не предоставлены, а автоматическое определение языка не выполнено. По умолчанию — |
TextTranslationSkillLanguage
Коды языков, поддерживаемые TextTranslationSkill для вводимого текста.
| Значение | Описание |
|---|---|
| af |
Африкаанс |
| ar |
Arabic |
| bn |
Бенгальский |
| bs |
Боснийский (латиница) |
| bg |
Болгарский |
| yue |
Кантонский (традиционное письмо) |
| ca |
Каталанский |
| zh-Hans |
китайский (упрощенный) |
| zh-Hant |
китайский (традиционный) |
| hr |
Croatian |
| cs |
Чешский |
| da |
Датский |
| nl |
Нидерландский |
| en |
English |
| et |
Эстонский |
| fj |
Фиджи |
| fil |
Филиппинский |
| fi |
Финский |
| fr |
French |
| de |
German |
| el |
Греческий |
| ht |
Гаитянский креольский |
| he |
Иврит |
| hi |
Хинди |
| mww |
Хмонг дау |
| hu |
Hungarian |
| is |
Исландский |
| id |
Indonesian |
| it |
Italian |
| ja |
Japanese |
| sw |
Kiswahili |
| tlh |
Клингонский |
| tlh-Latn |
Клингонский язык (латинская графика) |
| tlh-Piqd |
Клингонский (клингонское письмо) |
| ko |
Корейский |
| lv |
Латышский |
| lt |
Литовский |
| mg |
Малагасийский |
| ms |
Малайский |
| mt |
Мальтийский |
| nb |
Норвежский |
| fa |
Персидский |
| pl |
Polish |
| pt |
португальский |
| pt-br |
португальский (Бразилия) |
| pt-PT |
Португальский (Португалия) |
| otq |
Отоми — Керетаро |
| ro |
Румынский |
| ru |
Russian |
| sm |
Самоанский |
| sr-Cyrl |
Сербский (кириллица) |
| sr-Latn |
Сербский (латиница) |
| sk |
Словацкий |
| sl |
Словенский |
| es |
испанский |
| sv |
Шведский |
| ty |
Таитянский |
| ta |
Тамильский |
| te |
Телугу |
| th |
Тайский |
| to |
Тонганский |
| tr |
Турецкий |
| uk |
Ukrainian |
| ur |
Урду |
| vi |
Вьетнамский |
| cy |
Валлийский |
| yua |
Юкатекский майя |
| ga |
Ирландский |
| kn |
Каннада |
| mi |
Маори |
| ml |
Малаялам |
| pa |
Панджаби |
VisualFeature
Строки, указывающие, какие типы визуальных элементов следует возвращать.
| Значение | Описание |
|---|---|
| adult |
Визуальные признаки признаются совершеннолетними лицами. |
| brands |
Визуальные особенности признаны коммерческими брендами. |
| categories |
Категории. |
| description |
Description. |
| faces |
Визуальные особенности, распознаваемые как лица людей. |
| objects |
Визуальные элементы распознаются как объекты. |
| tags |
Теги. |
WebApiSkill
Навык, который может вызывать конечную точку веб-API, позволяя расширить набор навыков, заставив его вызывать ваш пользовательский код.
| Имя | Тип | Описание |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Фрагмент URI, указывающий тип навыка. |
| authIdentity | SearchIndexerDataIdentity: |
Назначаемое пользователем управляемое удостоверение, используемое для исходящих подключений. Если указан authResourceId, но он не указан, используется управляемое удостоверение, назначенное системой. При обновлении индексатора, если идентификатор не указан, значение остается неизменным. Если установлено значение "none", значение этого свойства очищается. |
| authResourceId |
string |
Применяется к пользовательским навыкам, которые подключаются к внешнему коду в функции Azure или другом приложении, выполняющем преобразования. Это значение должно быть идентификатором приложения, созданным для функции или приложения при его регистрации в Azure Active Directory. Если пользовательский навык указан, он подключается к функции или приложению с помощью управляемого идентификатора (системного или назначаемого пользователем) службы поиска и маркера доступа функции или приложения, используя это значение в качестве идентификатора ресурса для создания области маркера доступа. |
| batchSize |
integer (int32) |
Желаемый размер пакета, который указывает на количество документов. |
| context |
string |
Представляет уровень, на котором выполняются операции, например корневой каталог документа или содержимое документа (например, /document или /document/content). Значение по умолчанию — /document. |
| degreeOfParallelism |
integer (int32) |
Если задано, количество параллельных вызовов, которые могут быть выполнены к веб-API. |
| description |
string |
Описание навыка, которое описывает входы, выходы и использование навыка. |
| httpHeaders |
object |
Заголовки, необходимые для выполнения http-запроса. |
| httpMethod |
string |
Метод для http-запроса. |
| inputs |
Входными данными навыков может быть столбец в исходном наборе данных или выходные данные вышестоящего навыка. |
|
| name |
string |
Название навыка, которое однозначно идентифицирует его в наборе навыков. Навыку, имя которого не определено, будет присвоено по умолчанию в виде индекса из 1 в массиве навыков, начинающегося с префикса '#'. |
| outputs |
Выходными данными навыка является либо поле в индексе поиска, либо значение, которое может быть использовано в качестве входных данных другим навыком. |
|
| timeout |
string (duration) |
Требуемое время ожидания для запроса. Значение по умолчанию — 30 секунд. |
| uri |
string |
URL-адрес веб-API. |