Поделиться через


Связывание сущностей когнитивного навыка (версия 3)

Навык связывания сущностей (v3) возвращает список распознанных сущностей со ссылками на статьи в известной база знаний (Википедия).

Примечание.

Этот навык привязан к моделям машинного обучения для связывания сущностей в Azure Vision в средстве Foundry. Для транзакций, превышающих 20 документов в день, требуется оплачиваемый ресурс для транзакций, превышающих 20 документов на индексатор. Выполнение встроенных навыков взимается по существующей цене средств Foundry Standard.

@odata.type

Microsoft.Skills.Text.V3.EntityLinkingSkill

Ограничения данных

Максимальный размер записи — 50 000 знаков по оценке String.Length. Если вам нужно разбить данные перед отправкой для применения навыка "связывание сущностей", используйте навык разделение текста. Если вы используете навык разделения текста, задайте длину страницы равным 5000 для оптимальной производительности.

Параметры навыков

Имена всех параметров чувствительны к регистру и являются необязательными.

Наименование параметра Описание
defaultLanguageCode Код языка вводимого текста. Если языковой код по умолчанию не указан, английский (en) используется в качестве языкового кода по умолчанию.
Полный список поддерживаемых языков.
minimumPrecision Значение от 0 до 1. Если оценка достоверности (в выходных entities данных) ниже этого значения, сущность не возвращается. По умолчанию установлено значение 0.
modelVersion (Необязательно) Указывает версию модели, используемую при вызове связывания сущностей. По умолчанию используется последняя доступная, если она не указана. Мы рекомендуем не указывать это значение, если это не необходимо.

Входные данные навыков

Ввод имени Описание
languageCode Строка, указывающая язык записей. Если этот параметр не указан, код языка по умолчанию используется для анализа записей.
Полный список поддерживаемых языков.
text Текст для анализа.

Выходные данные навыка

Имя вывода Описание
entities Массив сложных типов, содержащий следующие поля:
  • "name" (Фактическое имя сущности, отображаемого в тексте)
  • "id"
  • "language" (Язык текста, определяемый навыком)
  • "url" (Связанный URL-адрес этой сущности)
  • "bingId" (BingId для этой связанной сущности)
  • "dataSource" (Источник данных, связанный с URL-адресом)
  • "matches"(Массив сложных типов, содержащих: text, offsetlength и confidenceScore)

Пример определения

  {
    "@odata.type": "#Microsoft.Skills.Text.V3.EntityLinkingSkill",
    "context": "/document",
    "defaultLanguageCode": "en", 
    "minimumPrecision": 0.5, 
    "inputs": [
        {
            "name": "text", 
            "source": "/document/content"
        },
        {
            "name": "languageCode", 
            "source": "/document/language"
        }
    ],
    "outputs": [
        {
            "name": "entities", 
            "targetName": "entities" 
        }
    ]
}

Пример ввода

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "Microsoft is liked by many.",
             "languageCode": "en"
           }
      }
    ]
}

Пример полученных результатов

{
  "values": [
    {
      "recordId": "1",
      "data" : 
      {
        "entities": [
          {
            "name": "Microsoft", 
            "id": "Microsoft",
            "language": "en", 
            "url": "https://en.wikipedia.org/wiki/Microsoft", 
            "bingId": "a093e9b9-90f5-a3d5-c4b8-5855e1b01f85", 
            "dataSource": "Wikipedia", 
            "matches": [
                {
                    "text": "Microsoft", 
                    "offset": 0, 
                    "length": 9, 
                    "confidenceScore": 0.13 
                }
            ]
          }
        ],
      }
    }
  ]
}

Смещения, возвращаемые для сущностей в выходных данных этого навыка, возвращаются непосредственно из API-интерфейсов языковой службы, что означает, что если вы используете их для индексирования в исходной строке, следует использовать класс StringInfo в .NET для извлечения правильного содержимого. Дополнительные сведения см. в разделе "Поддержка многоязычных и эмодзи" в функциях языковой службы.

Примеры предупреждений

Если код языка для документа не поддерживается, возвращается предупреждение и сущности не извлекаются.

См. также