Поделиться через


Примечание открытости для извлечения ключевых фраз

Это важно

Для удобства предоставляются только переводы, отличные от английского языка. Ознакомьтесь с EN-US версией этого документа для окончательной версии.

Что такое примечание о прозрачности?

Это важно

В этой статье предполагается, что вы знакомы с рекомендациями и лучшими практиками по языку Azure в инструментах Foundry. Дополнительные сведения см. в заметке о прозрачности языка.

В систему ИИ входит не только технология, но и ее пользователи, люди, на которых она повлияет, а также среда, в которой она будет развернута. Создание системы, соответствующей её целевому назначению, требует понимания того, как работает технология, её возможностей и ограничений, а также того, как добиться наилучшей производительности. Заметки о прозрачности корпорации Майкрософт предназначены для того, чтобы помочь вам понять, как работает наша технология ИИ, как владельцы систем могут повлиять на производительность и поведение системы, а также важность думать о всей системе, включая технологию, людей и окружающую среду. Вы можете использовать информационные статьи при разработке или развертывании собственной системы, а также предоставить к ним доступ пользователям, которые будут использовать вашу систему или которых она затрагивает.

Заметки о прозрачности Корпорации Майкрософт являются частью более широких усилий корпорации Майкрософт по внедрению принципов искусственного интеллекта на практике. Дополнительные сведения см. в статье "Принципы ответственного искусственного интеллекта" от Корпорации Майкрософт.

Общие сведения о извлечении ключевых фраз

Функция извлечения ключевых фраз языка позволяет быстро определить основные понятия в тексте. Например, в тексте "Еда была вкусной и были замечательные сотрудники", Извлечение ключевых фраз вернет основные разговорные моменты: "еда" и "замечательный персонал". Несущественные слова отбрасываются, а отдельные термины или фразы, которые, как представляется, являются подлежащим или дополнением предложения, возвращаются.

Обратите внимание, что показатель уверенности для этой функции не возвращается, в отличие от некоторых других языковых функций.

Примеры вариантов использования

Извлечение ключевых фраз используется в нескольких сценариях в различных отраслях. Ниже приведены некоторые примеры:

  • Улучшение поиска. Ключевые фразы можно использовать для создания индекса поиска, который может улучшить результаты поиска. Например, клиенты могут предоставлять тысячи документов, а затем запускать извлечение ключевых фраз поверх него с помощью встроенного навыка поиска Azure. Результатом этого являются ключевые фразы из входного набора данных, который затем можно использовать для создания индекса. Этот индекс можно обновить, выполнив навык снова, когда доступен новый набор документов.
  • Просмотр статистических тенденций в текстовых данных. Например, облако word можно создать с помощью ключевых фраз, которые помогут визуализировать ключевые понятия в текстовых комментариях или обратной связи. Например, отель может создать облако слов на основе ключевых фраз, определенных в своих комментариях, и увидеть, что люди чаще всего комментируют расположение, чистоту и отзывчивость персонала.

Рекомендации при выборе варианта использования

Не используйте

  • Не используйте для автоматических действий без вмешательства человека для сценариев высокого риска. Человек всегда должен просматривать исходные данные, когда затрагивается экономическая ситуация, здоровье или безопасность другого человека.

Юридические и нормативные соображения: организациям необходимо оценить потенциальные определенные юридические и нормативные обязательства при использовании любых служб и решений ИИ, которые могут быть не подходящими для использования в каждой отрасли или сценарии. Кроме того, службы или решения ИИ не предназначены для использования и не могут использоваться способами, запрещенными в применимых условиях обслуживания и соответствующих кодексах поведения.

Характеристики и ограничения

В зависимости от сценария и входных данных можно столкнуться с разными уровнями производительности. Следующие сведения предназначены для понимания ключевых понятий о производительности при использовании функции извлечения ключевых фраз языка.

Ограничения системы и рекомендации по повышению производительности

В отличие от других моделей языковых функций, модель ключевого извлечения фраз является ненаблюдаемой моделью, которая не обучена на человеческих размеченных истинных данных. Все именные группы в тексте, отправленном в службу, выделяются, а затем ранжируются на основе частоты и совстречаемости. Поэтому то, что возвращается моделью, может не совпадать с тем, что человек посчитает наиболее важными фразами. В некоторых случаях модель может быть частично правильной, в том случае, когда существительное возвращается без прилагательного, который изменяет его.

  • Более длинный текст будет работать лучше. Не разрывайте исходный текст на части, такие как предложения или абзацы. Отправьте весь текст, например полный отзыв клиента или аннотацию статьи.
  • Если текст содержит некоторые стандартные или другие тексты, которые не имеют актуальной релевантности к фактическому содержимому, которое вы пытаетесь проанализировать, слова в этом тексте повлияют на результаты. Например, сообщения электронной почты могут содержать "Тема:", "Текст:", "Отправитель:" и т. д. в тексте. Мы рекомендуем удалить любой известный текст, который не является частью фактического содержимого, который вы пытаетесь проанализировать перед отправкой его в службу.

См. также