Настройка кэша обогащения

Important

Эта функция предоставляется в общедоступной предварительной версии в соответствии с дополнительными условиями использования. Предварительная версия REST API поддерживает эту функцию.

В этой статье рассматривается, как добавить кэширование в конвейер обработки набора навыков, чтобы можно было изменять последующие шаги обогащения без полной пересборки каждый раз. По умолчанию набор навыков не имеет состояния, и изменение любой его части требует полного повторного запуска индексатора. При использовании кэша обогащения индексатор определяет, какие части дерева документов должны обновляться на основе изменений определения набора навыков или индексатора. Существующие обработанные выходные данные сохраняются и повторно используется по возможности.

Кэшированное содержимое помещается в службу хранилища Azure с помощью предоставленной строки подключения. Эти объекты создаются при запуске индексатора. Его следует рассматривать как внутренний компонент, управляемый службой поиска, и не следует изменять.

  • Контейнер с именем ms-az-search-indexercache-<alpha-numeric-string>
  • Таблицы с именем MsAzSearchIndexerCacheIndex<alpha-numeric-string>

Prerequisites

Вы должны быть знакомы с настройкой индексаторов и наборов навыков. Начните с обзора индексатора, а затем перейдите к наборам навыков, чтобы узнать о конвейерах обогащения.

Limitations

Caution

Если вы используете индексатор SharePoint (предварительная версия), следует избегать добавочного обогащения. При определенных обстоятельствах кэш становится недействительным, требуя сброса индексатора и полного перестроения, если вы решите перезагрузить его.

Permissions

Для идентификатора Поиск с использованием ИИ Azure требуется доступ на запись в служба хранилища Azure.

  • Сотрудник по работе с BLOB-данными хранилища
  • Сотрудник по работе с данными в таблицах хранилища

Синтаксис строки подключения определяет, используется ли назначаемое системой удостоверение или удостоверение, назначаемое пользователем. Для получения дополнительной информации см. статью «Подключение к хранилищу Azure с помощью управляемого удостоверения».

Установка свойства кэша

Используйте эту процедуру для новых и существующих индексаторов.

В определении индексатора задайте следующие значения cache :

  • (Обязательно) storageConnectionString укажите строку подключения к службе хранилища Azure.
  • (Необязательно) enableReprocessing (true по умолчанию). Установите значение false для временного приостановления добавочного обогащения, а позже переключите его обратно на true.
  1. Слева выберите индексаторы.

  2. Выберите "Добавить индексатор" , чтобы создать индексатор или открыть существующий в режиме редактирования JSON.

  3. Включите инкрементное обогащение, задайте учетную запись для хранения кэша обогащения и сохраните индексатор.

    Снимок экрана: опция в портале Azure для обогащения кэша.

  4. Сбросьте индексатор, если он уже существует.

  5. Запустите индексатор. Это однократное полное перестроение инициализирует кэш. После загрузки добавочное повторное использование применяется к последующим запускам.