Создание агента данных Fabric (предварительная версия)
С помощью агента данных в Microsoft Fabric можно создавать диалоговые интерфейсы ИИ, которые отвечают на вопросы о данных, хранящихся в озерах, хранилищах, семантических моделях Power BI и базах данных KQL в Fabric. Ваши данные становятся доступными. Ваши коллеги могут задавать вопросы на простом английском языке и получать ответы на основе данных, даже если они не являются экспертами ИИ или глубоко знакомы с данными.
Это важно
Эта функция доступна в предварительной версии.
Предпосылки
- платный ресурс емкости Fabric F64 или выше
- параметры клиента агента данных Fabric включены.
- Включен коммутатор клиента Copilot.
- Включена перекрестная геообработка для ИИ.
- включено межрегиональное хранение для ИИ.
- По крайней мере одно из них: хранилище, озеро, одна или несколько семантических моделей Power BI или база данных KQL с данными.
- семантические модели Power BI с помощью коммутатора клиента конечных точек XMLA включены для источников данных семантической модели Power BI.
Комплексный процесс создания и потребления агентов данных Fabric
В этом разделе описаны основные шаги по созданию, проверке и совместному использованию агента данных Fabric в Fabric, что делает его доступным для использования.
Процесс прост, и вы можете начать тестирование ресурсов агента данных Fabric за считанные минуты.
Создайте нового агента данных Fabric
Чтобы создать нового агента данных Fabric, сначала перейдите в рабочую область, а затем нажмите кнопку «+ Новый элемент». На вкладке "Все элементы" найдите #C0 агент данных Fabric #C1, чтобы найти соответствующую опцию, как показано на снимке экрана.
#B0 #A1 #A2 #A3 снимок экрана: создание агента данных Fabric. #A4 #A5 #A6 #C7
После выбора вам будет предложено указать имя агента данных Fabric, как показано на снимке экрана:
#B0 #A1 #A2 #A3 снимок экрана, показывающий, как задать имя агенту данных Fabric. #A4 #A5 #A6 #C7
См. приведенный снимок экрана для визуального руководства по именованию агента данных Fabric. После ввода имени перейдите к конфигурации, чтобы настроить агент данных Fabric в соответствии с вашими конкретными требованиями.
Выбор данных
После создания агента данных Fabric можно добавить до пяти источников данных, включая lakehouses, хранилища, семантические модели Power BI и базы данных KQL в любом сочетании. Например, можно добавить пять семантических моделей Power BI или две семантические модели Power BI, одно озеро и одну базу данных KQL.
При первом создании агента данных Fabric и предоставлении имени каталог OneLake автоматически отображается, что позволяет добавлять источники данных. Чтобы добавить источник данных, выберите его из каталога, как показано на следующем экране, а затем выберите Добавить. Каждый источник данных должен быть добавлен по отдельности. Например, можно добавить озерный дом (lakehouse), выбрать Добавить, а затем перейти к добавлению другого источника данных. Чтобы отфильтровать типы источников данных, выберите значок фильтра и выберите нужный тип. Вы можете просматривать только источники данных выбранного типа, что упрощает поиск и подключение соответствующих источников для агента данных Fabric.
После добавления источника данных Обозреватель на левой панели страницы агента данных Fabric заполняется доступными таблицами для каждого выбранного источника данных. Здесь вы можете использовать флажки, чтобы сделать таблицы доступными или недоступными для ИИ, как показано на следующем снимке экрана.
Примечание.
Для добавления семантической модели Power BI в качестве источника данных в агент данных Fabric требуется разрешение на чтение и запись.
Для последующих добавлений источников данных перейдите к Обозреватель на левой панели страницы агента данных Fabric и выберите + Источник данных, как показано на этом снимке экрана:
Каталог OneLake открывается снова, и вы можете легко добавить дополнительные источники данных по мере необходимости.
Подсказка
Обязательно используйте описательные имена как для таблиц, так и для столбцов. Таблица с именем SalesData
более значима, чем TableA
, а имена столбцов, например ActiveCustomer
или IsCustomerActive
, более понятны, чем C1
или ActCu
. Описательные имена помогают ИИ создавать более точные и надежные запросы.
Вопросы и ответы
После добавления источников данных и выбора соответствующих таблиц для каждого источника данных можно начать задавать вопросы. Система обрабатывает вопросы, как показано на этом снимке экрана:
Снимок экрана с вопросом для агента данных Fabric.
Вопросы, аналогичные этим примерам, также должны работать:
- Каков был наш общий объем продаж в Калифорнии в 2023 году?
- Какие 5 продуктов с самыми высокими ценами, и каковы их категории?
- "Какие самые дорогие товары, которые никогда не были проданы?"
Такие вопросы подходят, так как система может преобразовать их в структурированные запросы (T-SQL, DAX или KQL), выполнить их для баз данных, а затем возвращать конкретные ответы на основе сохраненных данных.
Однако такие вопросы не входят в сферу:
- Почему производительность нашего завода ниже во втором квартале 2024 года?
- "Что является первопричиной нашего всплеска продаж?"
Эти вопросы в настоящее время недоступны, так как для них требуются сложные причины, анализ корреляции или внешние факторы, недоступные непосредственно в базе данных. Агент данных Fabric в настоящее время не выполняет расширенную аналитику, машинное обучение или причинное вывод. Он просто извлекает структурированные данные и обрабатывает их на основе запроса пользователя.
Когда вы задаете вопрос, агент данных Fabric использует API помощника Azure OpenAI для обработки запроса. Поток работает таким образом:
Доступ к схеме по учетным данным пользователя
Система сначала использует учетные данные пользователя для доступа к схеме источника данных (например, Lakehouse, хранилища, семантической модели PBI или баз данных KQL). Это гарантирует, что система получает сведения о структуре данных, если у пользователя есть разрешение на просмотр.
Создание подсказки
Чтобы интерпретировать вопрос пользователя, система объединяет:
- Запрос пользователя: вопрос естественного языка, предоставленный пользователем.
- Сведения о схеме: метаданные и структурные сведения источника данных, полученные на предыдущем шаге.
- Примеры и инструкции. Все предопределенные примеры (например, примеры вопросов и ответов) или конкретные инструкции, предоставляемые при настройке агента данных Fabric. Эти примеры и инструкции помогают уточнить понимание вопроса и направляют ИИ в его взаимодействии с данными.
Вся эта информация используется для создания подсказки. Этот запрос используется как входные данные для API Помощника Azure OpenAI, который функционирует как агент, под агентом данных Fabric. Это, по сути, указывает агенту данных Fabric о том, как обрабатывать запрос, и тип ответа для создания.
Вызов инструмента в зависимости от потребностей запроса
Агент анализирует созданный запрос и решает, какой инструмент будет вызываться для получения ответа:
- Естественный язык в SQL (NL2SQL): используется для создания запросов SQL при расположении данных в озерном хранилище или хранилище.
- Естественный язык в DAX (NL2DAX): используется для создания запросов DAX для взаимодействия с семантических моделей в источниках данных Power BI
- Естественный язык к KQL (NL2KQL): используется для создания запросов KQL для запроса данных в базах данных KQL
Выбранное средство создает запрос с помощью схемы, метаданных и контекста, который предоставляет агент, базовый агент данных Fabric. Затем средство проверяет запрос, чтобы обеспечить надлежащее форматирование и соответствие своим протоколам безопасности и собственным политикам ответственного ИИ (RAI).
Построение ответов
Агент, базовый агент данных Fabric выполняет запрос и гарантирует, что ответ структурирован и отформатирован соответствующим образом. Агент часто включает дополнительный контекст, чтобы сделать ответ понятным для пользователя. Наконец, ответ отображается пользователю в интерфейсе беседы, как показано на следующем снимке экрана:
Агент представляет результат и промежуточные шаги, которые он принял для получения окончательного ответа. Этот подход повышает прозрачность и позволяет проверять эти шаги при необходимости. Пользователи могут развернуть раскрывающийся список действий, чтобы просмотреть все действия агента данных Fabric, принятые для получения ответа, как показано на следующем снимке экрана:
#B0 #A1 #A2 #A3 Снимок экрана. Шаги, выполненные агентом данных Fabric. #A4 #A5 #A6 #C7
Кроме того, агент данных Fabric предоставляет созданный код, используемый для запроса соответствующего источника данных, предоставляя дополнительные сведения о том, как был создан ответ.
Эти запросы предназначены исключительно для запроса данных. Операции, связанные с
- создание данных
- обновления данных
- Удаление данных
- любой тип изменения данных
не разрешено, чтобы защитить целостность ваших данных.
В любой момент можно выбрать кнопку "Очистить чат", чтобы очистить чат, как показано на следующем снимке экрана:
Функция "Очистить чат" удаляет всю историю чата и запускает новый сеанс. После удаления журнала чата его невозможно получить.
Изменение источника данных
Чтобы удалить источник данных, наведите указатель мыши на имя источника данных в обозревателе на левой панели страницы агента данных Fabric до тех пор, пока не появится меню с тремя точками. Выберите три точки, чтобы отобразить параметры, а затем выберите Удалить, чтобы удалить источник данных, как показано на следующем снимке экрана:
Кроме того, если источник данных изменился, можно выбрать Обновить в том же меню, как показано на следующем снимке экрана.
Это гарантирует, что все обновления источника данных отражаются и правильно заполнены в обозревателе, чтобы агент данных Fabric синхронизировался с последними данными.
Конфигурация агента данных Fabric
Агент данных Fabric предлагает несколько вариантов конфигурации, позволяющих пользователям настраивать поведение агента данных Fabric, чтобы лучше соответствовать потребностям вашей организации. Как агент данных Fabric обрабатывает и представляет данные, эти конфигурации обеспечивают гибкость, которая обеспечивает более контроль над результатами.
Укажите инструкции
Вы можете указать конкретные инструкции по поведению ИИ. Чтобы добавить их в область инструкций агента данных Fabric, выберите инструкции агента данных, как показано на следующем снимке экрана:
#B0 #A1 #A2 #A3 снимок экрана, показывающий выбор кнопки с инструкциями по работе с агентом данных. #A4 #A5 #A6 #C7
Здесь можно написать до 15 000 символов в простом тексте на английском языке, чтобы указать ИИ о том, как обрабатывать запросы.
Например, можно указать точный источник данных, используемый для определенных типов вопросов. Примеры выбора источника данных могут включать указание ИИ, какой источник данных использовать.
- Семантические модели Power BI для финансовых запросов
- Озёрный дом данных для данных о продажах
- база данных KQL для операционных метрик
Эти инструкции гарантируют, что ИИ создает соответствующие запросы, будь то SQL, DAX или KQL, на основе ваших рекомендаций и контекста вопросов.
Если ресурс ИИ последовательно неправильно интерпретирует определенные слова, акронимы или термины, можно попытаться предоставить четкие определения в этом разделе, чтобы убедиться, что ИИ правильно понимает и обрабатывает их. Это особенно полезно для терминологии для конкретного домена или уникального бизнес-жаргона.
С помощью этих инструкций и определения терминов вы повышаете способность ИИ предоставлять точные и соответствующие аналитические сведения в полном соответствии с вашей стратегией данных и бизнес-требованиями.
Укажите примеры запросов
Вы можете повысить точность ответов агента данных Fabric при предоставлении примеров запросов, адаптированных к каждому источнику данных, таким как lakehouse, хранилище и базы данных KQL. Этот подход, известный как Few-Shot обучение в генерируемом ИИ, помогает агенту данных Fabric создавать ответы, которые лучше соответствуют вашим ожиданиям.
При предоставлении ИИ примерами пар запросов и вопросов он ссылается на эти примеры при ответе на будущие вопросы. Сопоставление новых запросов с наиболее актуальными примерами помогает ИИ включать логику для конкретного бизнеса и эффективно отвечать на часто задаваемые вопросы. Эта функция позволяет точно настроить отдельные источники данных и обеспечивает создание более точных запросов SQL или KQL.
В настоящее время данные семантической модели Power BI не поддерживают добавление примеров пар запросов и вопросов. Однако для поддерживаемых источников данных, таких как lakehouse, хранилище и базы данных KQL, дополнительные примеры могут значительно повысить способность ИИ создавать точные запросы, когда его производительность по умолчанию требует корректировки.
Подсказка
Разнообразный набор примеров запросов повышает способность агента данных Fabric создавать точные и соответствующие запросы SQL/KQL.
Чтобы добавить или изменить примеры запросов, нажмите кнопку примеры запросов, чтобы открыть область примеров запросов, как показано на следующем снимке экрана:
Эта область предоставляет параметры для добавления или изменения примеров запросов ко всем поддерживаемым источникам данных, кроме семантических моделей Power BI. Для каждого источника данных можно выбрать добавить или изменить примеры запросов для ввода соответствующих примеров, как показано на следующем снимке экрана:
Примечание.
Агент данных Fabric ссылается только на запросы, содержащие допустимый синтаксис SQL/KQL и соответствующие схеме выбранных таблиц. Агент данных Fabric не использует запросы, которые не завершили проверку. Убедитесь, что все примеры запросов действительны и правильно согласованы со схемой, чтобы агент данных Fabric эффективно их использовали.
Публикация и предоставление общего доступа к агенту данных Fabric
После тестирования производительности агента данных Fabric по различным вопросам, и вы подтверждаете, что он создает точные запросы SQL, DAX или KQL, вы можете поделиться им с коллегами. На этом этапе выберите Опубликовать, как показано на снимке экрана ниже:
#B0 #A1 #A2 #A3 Скриншот, показывающий публикацию агента данных Fabric. #A4 #A5 #A6 #C7
На этом шаге откроется окно, которое запрашивает описание агента данных Fabric. Ниже приведено подробное описание того, что делает агент данных Fabric. Эти сведения помогут вашим коллегам разобраться в функциональности агента данных Fabric и обеспечат другим системам и оркестраторам ИИ возможность эффективно вызывать агента данных Fabric.
После публикации агента данных Fabric у вас будет две версии его. Одна из версий — это текущая версия черновика, которую можно продолжать уточнять и улучшать. Вторая версия — это опубликованная версия, которую вы можете поделиться своими коллегами, которые хотят запросить агент данных Fabric, чтобы получить ответы на их вопросы. Вы можете включить отзывы коллег в текущую версию черновика при разработке, чтобы повысить производительность агента данных Fabric.