Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
В службе "Поиск ИИ Azure" можно использовать мастер импорта данных на портале Azure для создания рабочего процесса приложения логики, который индексирует и векторизирует содержимое. Эта возможность эквивалентна индексатору и источнику данных, который создает конвейер индексирования и создает содержимое, доступное для поиска.
После создания рабочего процесса в мастере можно управлять рабочим процессом в Azure Logic Apps вместе с другими рабочими процессами. За кулисами мастер следует шаблону рабочего процесса, который извлекает содержимое из источника для индексирования в поиске ИИ. Соединители, используемые в этом сценарии, предварительно созданы и уже существуют в Azure Logic Apps, поэтому шаблон рабочего процесса просто предоставляет сведения об этих соединителях для создания подключений к источнику данных, поиску ИИ и другим элементам для завершения рабочего процесса приема.
Ключевые особенности
Интеграция Azure Logic Apps в Службе поиска ИИ Azure добавляет поддержку:
- Дополнительные источники данных от Майкрософт и других поставщиков
- Встроенная векторизация
- Запланированное или по запросу индексирование
- Обнаружение изменений в новых и существующих документах
Входные данные мастера импорта данных включают:
- Поддерживаемый источник данных
- Поддерживаемая модель внедрения текста
После завершения работы мастера у вас есть следующие компоненты:
| Компонент | Местоположение | Description |
|---|---|---|
| Индекс поиска | Поиск с использованием ИИ Azure | Содержит индексированное содержимое из поддерживаемого коннектора Logic Apps. Схема индекса — это индекс по умолчанию, созданный мастером. Можно добавить дополнительные элементы, такие как профиль оценки или семантическая конфигурация, но нельзя изменить существующие поля. Вы просматриваете, управляете и обращаетесь к индексу поиска в службе "Поиск ИИ Azure". |
| Ресурс приложения логики и рабочий процесс | Приложения логики Azure | Вы можете просмотреть запущенный рабочий процесс или открыть конструктор в Azure Logic Apps, чтобы изменить рабочий процесс, как вы регулярно делаете, если вы начали работу с Azure Logic Apps. Вы можете изменять и расширять рабочий процесс, но соблюдать осторожность, чтобы не нарушать конвейер индексирования. Рабочий процесс, созданный мастером, использует опцию размещения потребления. |
| Шаблоны приложений логики | Приложения логики Azure | До двух шаблонов, созданных для каждого рабочего процесса: один для индексирования по запросу и второй шаблон для запланированного индексирования. Расписание индексирования можно изменить на шаге " Индексировать несколько документов " рабочего процесса. |
Предпосылки
Перед началом работы ознакомьтесь со следующими требованиями:
Вы должны быть владельцем или участником в подписке Azure с разрешениями на создание ресурсов.
Служба "Поиск ИИ Azure", ценовая категория "Базовый" или выше, если вы хотите использовать идентификацию службы поиска для подключений к источнику данных Azure, в противном случае можно использовать любой уровень с ограничениями уровня.
Azure OpenAI с развертыванием поддерживаемой модели встраивания. Векторизация интегрирована в рабочий процесс. Если вам не нужны векторы, можно игнорировать поля или попробовать другую стратегию индексирования.
Azure Logic Apps — это поддерживаемый регион. Он должен иметь управляемое удостоверение, назначаемое системой , если вы хотите использовать проверку подлинности идентификатора Microsoft Entra для подключений, а не ключей API.
Замечание
Рабочий процесс приложения логики — это оплачиваемый ресурс. Дополнительные сведения см. в разделе о ценах на Azure Logic Apps.
Поддерживаемые регионы
Сквозная функциональность доступна в следующих регионах, которые обеспечивают подключение к источнику данных, анализ документов, фрагменты документов, поддержку моделей встраивания Azure OpenAI, а также встроенную поддержку индексирования данных. Следующие регионы для Azure Logic Apps предоставляют ParseDocument действие, на основе которого основана интеграция индексирования.
- East US
- Восток США 2
- Южно-Центральная часть США
- Западная часть США 2
- Западная часть США 3
- Бразилия (Юг)
- Australia East
- East Asia
- Юго-Восточная Азия
- North Europe
- Центральная Швеция
- UK South
Поддерживаемые модели
Путь приложения логики через мастер импорта данных поддерживает выбор моделей внедрения.
Разверните одну из следующих моделей внедрения в Azure OpenAI для комплексного рабочего процесса.
- Встраивание текста - версия 3 - малая
- текст-встраивание-3-большой
- text-embedding-ada-002
Поддерживаемые соединители
Следующие соединители полезны для индексирования неструктурированных данных в дополнение к классическим индексаторам, предназначенным главным образом для структурированных данных.
Поддерживаемые действия
Интеграция приложений логики включает следующие действия индексирования. Дополнительные сведения см. в статье "Подключение к средствам Foundry" из рабочих процессов в Azure Logic Apps.
- Проверьте наличие новых данных.
- Получение данных. Действие HTTP, которое извлекает отправленный документ с помощью URL-адреса файла из выходных данных триггера.
- Создание сведений о документе. Действие операций с данными, сцепляющее различные элементы.
- Создайте строку токена. Действие операций с данными, которое создает токен строку, используя данные, полученные от действия Compose.
- Создание блоков содержимого. Действие обработки данных, разделяющее строку с токенами на части на основе числа символов или токенов на блок содержимого.
- Преобразуйте маркеризованные данные в JSON. Действие по обработке данных, которое преобразует строковые сегменты маркеров в массив JSON.
- Выберите элементы массива JSON. Действие "Операции данных", которое выбирает несколько элементов из массива JSON.
- Создайте эмбеддинги. Действие Azure OpenAI, которое создает векторные встраивания в каждом элементе массива JSON.
- Выберите встраивания и другую информацию. Операция по обработке данных, которая выбирает встраивания и другие сведения о документе.
- Индексирование данных. Действие поиска ИИ Azure, которое индексирует данные на основе каждого выбранного внедрения.
Он также поддерживает следующие действия запроса:
- Дождитесь появления приглашения для ввода. Триггер, который либо опрашивает, либо ожидает поступления новых данных: в первом случае — на основе заданного интервала, а во втором — в ответ на конкретные события.
- Входное системное сообщение для модели. Действие операций с данными, которое предоставляет входные данные для обучения модели.
- Вводимые примеры вопросов и ответов. Действие в рамках "Операций с данными", предоставляющее примеры вопросов клиентов и связанные роли для обучения модели.
- Входное системное сообщение для запроса поиска. Действие операций с данными, которое предоставляет входные данные поискового запроса для обучения модели.
- Создайте поисковый запрос. Действие встроенного кода, использующее JavaScript для создания поискового запроса для векторного хранилища на основе выходных данных из предыдущих действий Compose.
- Преобразование запроса в эмбеддинг. Действие Azure OpenAI, подключающееся к API завершения чата и гарантирующее надежные ответы в чатах.
- Получите встраивание. Действие Azure OpenAI, которое получает одно векторное представление.
- Выполните поиск векторной базы данных. Действие поиска ИИ Azure, которое выполняет поиск в хранилище векторов.
- Создайте запрос. Действие встроенного кода, использующее JavaScript для создания запросов.
- Выполнить завершение чата. Действие Azure OpenAI, подключающееся к API завершения чата и гарантирующее надежные ответы в чатах.
- Вернуть ответ. Действие запроса, которое возвращает результаты вызывающему, при использовании триггера запроса.
Ограничения
- Индекс поиска создается с помощью фиксированной схемы (идентификатор документа, содержимого и векторизованного содержимого) только с извлечением текста. Индекс можно изменить , пока обновление не влияет на существующие поля.
- Векторизация поддерживает только внедрение текста.
- Обнаружение удаления не поддерживается. Необходимо вручную удалить потерянные документы из индекса.
- Повторяющиеся документы в индексе поиска являются известной проблемой в этой предварительной версии. Рассмотрите возможность удаления объектов и начала заново, если это становится проблемой.
- Отсутствие поддержки частных конечных точек в рабочем процессе приложения логики, созданного с помощью мастера портала. Рабочий процесс размещается с помощью варианта размещения Consumption и подчиняется его ограничениям. Чтобы использовать стандартный вариант размещения, используйте программный подход к созданию рабочего процесса.
Создание рабочего процесса приложения логики
Выполните следующие действия, чтобы создать рабочий процесс приложения логики для индексирования содержимого в службе "Поиск ИИ Azure".
Запустите мастер импорта данных на портале Azure.
В разделе "Подключение к данным" укажите префикс имени, используемый для индекса поиска и рабочего процесса. Наличие общего имени помогает управлять ими вместе.
Укажите частоту индексирования. Если выбрать расписание, шаблон, включающий параметр планирования, используется для создания рабочего процесса. Вы можете изменить расписание индексирования в шаге индекса нескольких документов рабочего процесса после его создания.
Выберите тип проверки подлинности, в котором рабочий процесс приложения логики подключается к поисковой системе и запускает процесс индексирования. Рабочий процесс может подключаться с помощью ключей API поиска ИИ Azure или мастер может создать назначение ролей, которое предоставляет разрешения на управляемое удостоверение, назначаемое системой Logic Apps, если он существует.
Нажмите кнопку "Далее ", чтобы перейти к следующей странице.
В Vectorize Your Text укажите информацию о развертывании модели и подключении Azure OpenAI. Выберите подписку и службу, поддерживаемую модель внедрения текста и тип проверки подлинности, который рабочий процесс использует для подключения к Azure OpenAI.
Нажмите кнопку "Далее ", чтобы перейти к следующей странице. Просмотрите конфигурацию.
Нажмите кнопку "Создать", чтобы начать обработку.
Рабочий процесс запускается как бессерверный процесс в Logic Apps (Consumption), отдельно от службы поиска ИИ.
Подтвердите создание индекса на портале Azure на странице индексов в службе "Поиск ИИ Azure". Обозреватель поиска — это первая вкладка. Выберите "Поиск", чтобы вернуть некоторое содержимое.
Изменение существующих объектов
Вы можете внести следующие изменения в индекс поиска, не нарушая индексирование:
- Добавление профилей оценки
- Добавление семантического ранжирования
- Добавление проверки орфографии
- Добавление карт синонимов
- Добавление предложения
Вы можете внести следующие обновления в рабочий процесс, не нарушая индексирование:
- Измените файлы списка в папке , чтобы изменить количество документов, отправленных в индексирование.
- Измените фрагмент текста, чтобы варьировать входные токены. Рекомендуемый размер токенов — 512 токенов для большинства сценариев.
- Измените фрагмент текста , чтобы добавить длину перекрытия страницы.
- Измените шаг "Индексировать несколько документов ", чтобы управлять частотой индексирования, если вы выбрали запланированное индексирование в мастере.
В конструкторе приложений логики просмотрите рабочий процесс и каждый шаг в конвейере индексирования. Рабочий процесс определяет извлечение документов, фрагментирование документов по умолчанию (навык разделения текста), внедрение (навык внедрения Azure OpenAI), сопоставления полей вывода и, наконец, индексирование.
Управление шаблонами и рабочими процессами
Мастер создает шаблоны и рабочие процессы при указании индексатора Logic Apps. Чтобы создать и управлять ими, включая удаление шаблона, используйте конструктор приложений логики. Панель мониторинга службы поиска на портале Azure не предоставляет шаблоны или управление рабочими процессами, и в настоящее время в API поиска Azure AI нет программной поддержки.