Навыки для дополнительной обработки во время индексирования (поиск по искусственному интеллекту Azure)

В этой статье описаны навыки в поиске ИИ Azure, которые можно включить в набор навыков для доступа к внешней обработке.

Навык — это атомарная операция, которая преобразует содержимое каким-то образом. Часто это операция, которая распознает или извлекает текст, но это также может быть утилитарной функцией, которая изменяет существующие улучшения. Выходные данные обычно основаны на тексте для использования в полнотекстовом поиске или векторах для использования в векторном поиске.

Навыки организованы по следующим категориям:

  • Встроенный навык упаковывает вызовы API к другому ресурсу Azure, где хорошо понятны входные данные, выходные данные и шаги обработки. Некоторые встроенные навыки требуют присоединенного ресурса исключительно для выставления счетов, а другие используют модель или ресурс, размещенный в Azure, для выставления счетов и обработки.

  • Пользовательский навык предоставляет пользовательский код, который выполняется вне службы поиска. К нему обращается URI. Пользовательский код часто доступен через приложение-функцию Azure. Чтобы подключить модель векторизации с открытым исходным кодом или сторонней стороны, используйте пользовательский навык.

  • Вспомогательный навык является внутренним элементом поиска Azure AI и не зависит от внешних ресурсов или исходящих подключений. Большинство утилитарных навыков являются некоммерческими.

Built-in skills

Существует два типа встроенных навыков:

Foundry resource

Навыки в этой категории вызывают подслужбы средств Foundry. Для выставления счетов вместо обработки необходимо подключить ресурс Foundry к вашей компетенции. Поиск по искусственному интеллекту Azure использует внутренние ресурсы для выполнения этих навыков и использует только ресурс Foundry для выставления счетов.

Небольшое количество обработки не оплачивается, но при больших объемах обработка подлежит оплате. Эти навыки основаны на предварительно обученных моделях из средств Foundry, что означает, что вы не можете обучить модели с помощью собственных данных.

Эти навыки выставляются по тарифу «Стандартный».

Skill Description Metered by
Многомодальные внедрения в Azure Vision Многомодальное изображение и векторизация текста. Инструменты для литейного производства (цены)
Поиск настраиваемых сущностей Выполняет поиск текста в пользовательском списке слов и фраз. Поиск ИИ Azure (цены)
Entity Linking Этот навык использует предварительно обученную модель для создания ссылок для распознанных сущностей в статьях в Википедии. Инструменты для литейного производства (цены)
Entity Recognition Этот навык использует предварительно обученную модель, чтобы установить сущности для фиксированного набора категорий: полей "Person", "Location", "Organization", "Quantity", "DateTime", "URL", "Email", "PersonType", "Event", "Product", "Skill", "Address", "Phone Number" и "IP Address". Инструменты для литейного производства (цены)
Image Analysis Этот навык использует алгоритм обнаружения изображений, чтобы определить содержимое изображения и создать текстовое описание. Инструменты для литейного производства (цены)
Извлечение ключевых фраз. Этот навык использует предварительно обученную модель для выявления важных фраз в зависимости от расположения терминов, лингвистических правил, близости к другим терминам и того, насколько необычным является термин в исходных данных. Инструменты для литейного производства (цены)
Language Detection Этот навык использует предварительно обученную модель, чтобы определить используемый язык (один идентификатор языка на документ). Если в одних сегментах текста используется несколько языков, выводится код основного используемого языка. Инструменты для литейного производства (цены)
OCR Оптическое распознавание символов. Инструменты для литейного производства (цены)
PII Detection Этот навык использует предварительно обученную модель для извлечения личных сведений из предоставленного текста. Навык также предоставляет различные варианты маскирования обнаруженных сущностей с личными сведениями в тексте. Инструменты для литейного производства (цены)
Sentiment Этот навык использует предварительно обученную модель для назначения меток тональности (например, "отрицательная", "нейтральная" и "положительная") на основе оценки наивысшей достоверности, полученной службой на уровне предложения и документа для отдельных записей. Инструменты для литейного производства (цены)
Text Translation Этот навык использует предварительно обученную модель для перевода входного текста на различные языки для нормализации или локализации вариантов использования. Инструменты для литейного производства (цены)

Размещенная в Azure модель или ресурс

Навыки в этой категории взаимодействуют с размещенными в Azure моделями или ресурсами, которые вы используете как для выставления счетов, так и для обработки. Хотя служба "Распознавание содержимого Azure" входит в состав средств Foundry, навык "Понимание содержимого Azure" подключается к развернутому ресурсу для обработки, а не только для выставления счетов.

Эти навыки выставляются по тарифу «Стандартный».

Skill Description Metered by
Общие сведения о содержимом Azure Подключается к Azure Content Understanding для расширенного анализа документов и семантического фрагментирования. Общие сведения о содержимом Azure (цены)
Внедрение Azure OpenAI Подключается к развернутой модели внедрения Azure OpenAI для интегрированной векторизации. Azure OpenAI (цены)
GenAI Prompt Расширяет конвейер обогащения ИИ с помощью модели завершения чата Foundry. Azure OpenAI (цены)

Custom skills

Навыки в этой категории упаковывают внешний код, который вы проектируете, разрабатываете и развёртываете в веб-среду. Затем можно вызвать такой модуль из набора навыков в качестве пользовательского навыка.

Инструкции по созданию пользовательского навыка см. в статьях Добавление пользовательского навыка в конвейер обогащения Когнитивного поиска Azure и Пример: создание пользовательского навыка с использованием API Поиска сущностей Bing.

Skill Description Metered by
AML Расширяет конвейер обогащения ИИ с помощью модели Foundry или Машинного обучения Azure. Нет, если ваше решение не использует службу Azure с лимитным лимитом.
Поиск настраиваемых сущностей Расширяет конвейер обогащения ИИ путем обнаружения определяемых пользователем сущностей. Нет, если ваше решение не использует службу Azure с лимитным лимитом.
Web API Расширяет конвейер обогащения ИИ, выполняя вызов HTTP в пользовательский веб-API. Нет, если ваше решение не использует службу Azure с лимитным лимитом.

Utility skills

Навыки в этой категории выполняются только в службе "Поиск ИИ Azure", в основном выполняются итерации на узлах в кэше обогащения и в основном не требуют оплаты.

Skill Description Metered by
Conditional Позволяет фильтровать, назначать значения по умолчанию и объединять данные на основе условия. Not applicable
Document Extraction Извлечение содержимого из файла в пределах конвейера обогащения. Поиск ИИ Azure (ценообразование) для обработки изображений
Shaper Сопоставляет выходные данные со сложным типом (составной тип данных, который может использоваться для полного имени, многострочного адреса или сочетания фамилии и личного идентификатора). Not applicable
Text Merge Объединяет текст из коллекции полей в одном поле. Not applicable
Text Split Разбивает текст на страницы, чтобы можно было постепенно обогатить или дополнить содержимое. Not applicable