Создание агента данных Fabric

С помощью агента данных в Microsoft Fabric можно создавать конверсционные ИИ-интерфейсы, которые отвечают на вопросы о данных, хранящихся в дата-озёрах, хранилищах данных, семантических моделях Power BI, базах данных KQL, онтологиях и графе Microsoft в Fabric. Ваши коллеги могут задавать вопросы на простом английском языке и получать ответы на основе данных, даже если они не являются экспертами ИИ или глубоко знакомы с данными.

Предпосылки

Проверка подлинности и токены

Вам не нужно создавать или предоставлять Azure ключ OpenAI или маркер доступа для использования агента данных Fabric. Fabric использует управляемого Microsoft Azure OpenAI Assistant и обрабатывает аутентификацию.

  • Доступ к данным выполняется под учетной записью пользователя Microsoft Entra ID и разрешениями на рабочую область и данные. Агент считывает схемы и запускает SQL/DAX/KQL, только если у вас есть доступ. Хотя большинство источников данных учитывают разрешения рабочей области, взаимодействие семантических моделей Power BI через агентов данных управляется разрешением на чтение уровня модели и не требует членства в роли рабочей области.
  • Чтобы добавить семантическую модель Power BI в качестве источника данных, требуется разрешение на чтение на данной модели (разрешение на запись не требуется). Доступ на чтение также достаточно, чтобы задавать вопросы об источниках, к которым у вас есть доступ. Дополнительные сведения о разрешениях семантической модели см. в разделе "Безопасность семантической модели" и "Набор данных". При использовании агента данных разрешение на чтение достаточно для запроса; Запись требуется только для изменения семантической модели или включения таких функций, как подготовка для искусственного интеллекта.
  • Если в вашей организации используется Power BI Premium на одно рабочее пространство (P1 или выше) вместо F SKU, убедитесь, что Microsoft Fabric активирован в этой категории.
  • Принципы обслуживания и токены API не требуются для использования чата внутри продукта. Любая автоматизация с субъектами-службами является отдельным сценарием и не рассматривается здесь.

Безопасность и управление

Агенты данных Fabric соблюдают политики управления Microsoft Purview. Если политики Purview ограничивают доступ к источнику данных (например, с помощью элементов управления доступом или меток конфиденциальности), агент учитывает эти ограничения при обработке запросов пользователей.

Расширенная защита исходящего доступа применяется к операциям агента. Исходящие подключения от агентов подчиняются правилам сети и доступа арендатора, которые настроены на портале администрирования Fabric. Администраторы могут управлять тем, к каким внешним конечным точкам разрешено доступ агентам.

Разрешения для семантических моделей с помощью агентов данных

Взаимодействие с семантическими моделями Power BI с агентом данных Fabric требует только разрешения на чтение для семантической модели. Доступ к рабочей области (роли Участника или Соучастника) и право на создание не требуются для добавления модели в агент или отправки вопросов через агент. Это исключение применяется только к взаимодействию агента данных; другие точки входа (например, анализ в Excel или при непосредственном создании отчётов) могут по-прежнему требовать разрешения на создание отчёта.

Разрешение на запись требуется только для изменения семантической модели или использования таких возможностей, как подготовка для искусственного интеллекта.

Доступ к данным между клиентами

Если рабочая область содержит данные, к которым предоставлен общий доступ из другого клиента через общий доступ к данным через OneLake, агент данных Fabric может запрашивать эти данные с помощью ярлыка OneLake, созданного в момент принятия совместного доступа. Дополнительная конфигурация аутентификации не требуется; доступ осуществляется под существующими удостоверениями Entra ID и разрешениями рабочей области. Политики управления клиента-потребителя применяются ко всем общим данным.

Комплексный поток для создания и использования агентов данных Fabric

В этом разделе описаны основные шаги по созданию, проверке и совместному использованию агента данных Fabric в Fabric, что делает его доступным для использования. Агент работает с управляемыми динамическими данными в OneLake, включая таблицы, поддерживаемые ярлыками OneLake и общими ресурсами между клиентами.

Процесс прост, и вы можете начать тестирование ресурсов агента данных Fabric за считанные минуты.

Создайте нового агента данных Fabric

Чтобы создать агент данных Fabric, сначала перейдите в рабочую область, а затем нажмите кнопку + Новый элемент. На вкладке "Все элементы" найдите агент данных Fabric, чтобы найти соответствующий вариант, как показано на снимке экрана.

Скриншот, показывающий создание агента данных Fabric.

После выбора вам будет предложено указать имя агента данных Fabric, как показано на этом снимке экрана:

Скриншот, показывающий, как задать имя для агента данных Fabric.

См. приведенный снимок экрана: визуальное руководство по именованию агента данных Fabric. После ввода имени приступите к настройке, чтобы агент данных Fabric соответствовал вашим конкретным требованиям.

Выбор данных

После создания агента данных Fabric можно добавить до пяти источников данных, включая lakehouses, хранилища, семантические модели Power BI, базы данных KQL, онтологии и Microsoft Graph в любом сочетании (до пяти общего количества). Например, можно добавить пять Power BI семантических моделей или две Power BI семантические модели, один лейкхаус и одну базу данных KQL.

Примечание.

Каталог OneLake может включать таблицы, предоставляемые с помощью сочетаний клавиш OneLake. Агенты данных Fabric могут напрямую запрашивать эти таблицы, основывающиеся на ярлыках, без копирования данных в рабочую область.

При первом создании агента данных Fabric и предоставлении имени каталог OneLake автоматически отображается, что позволяет добавлять источники данных. Чтобы добавить источник данных, выберите его из каталога, как показано на следующем экране, а затем нажмите кнопку "Добавить". Каждый источник данных должен быть добавлен по отдельности. Например, можно добавить lakehouse, нажать кнопку "Добавить", а затем перейти к добавлению другого источника данных. Чтобы отфильтровать типы источников данных, выберите значок фильтра и выберите нужный тип. Вы можете фильтровать по типу источника данных, чтобы найти источники проще, включая элементы, общие между границами организации, с помощью общего доступа к данным между клиентами.

После добавления источника данных Explorer на левой панели страницы агента данных Fabric заполняется доступными таблицами в каждом выбранном источнике данных, где можно использовать флажки, чтобы сделать таблицы доступными или недоступными для ИИ, как показано на следующем снимке экрана:

Снимок экрана: добавление источников данных.

Примечание.

Для добавления Power BI семантической модели в качестве источника данных требуется только разрешение на чтение. Разрешение на сборку не требуется, и пользователям не нужен доступ к рабочей области, в которой семантическая модель находится при использовании с помощью агента данных. Разрешение на запись требуется только для изменения семантической модели или использования таких возможностей, как подготовка для искусственного интеллекта.

Для последующих добавлений источников данных перейдите на страницу агента данных Explorer на левой панели страницы агента данных Fabric и выберите + Источник данных, как показано на этом снимке экрана:

Снимок экрана: добавление дополнительных источников данных.

Каталог OneLake открывается снова, и вы можете легко добавить дополнительные источники данных по мере необходимости.

Подсказка

Обязательно используйте описательные имена как для таблиц, так и для столбцов. Таблица с именем SalesData более значима, чем TableA, а имена столбцов, например ActiveCustomer или IsCustomerActive, более понятны, чем C1 или ActCu. Описательные имена помогают ИИ создавать более точные и надежные запросы.

Вопросы и ответы

После добавления источников данных и выбора соответствующих таблиц для каждого источника данных можно начать задавать вопросы. Система обрабатывает вопросы, как показано на этом снимке экрана:

Скриншот с вопросом для агента данных Fabric.

Вопросы, аналогичные этим примерам, также должны работать:

  • Каков был наш общий объем продаж в Калифорнии в 2023 году?
  • Какие 5 продуктов с самыми высокими ценами, и каковы их категории?
  • "Какие самые дорогие товары, которые никогда не были проданы?"

Такие вопросы подходят, так как система может преобразовать их в структурированные запросы (T-SQL, DAX или KQL), выполнить их для баз данных, а затем возвращать конкретные ответы на основе сохраненных данных.

Однако такие вопросы не входят в сферу:

  • Почему производительность нашего завода ниже во втором квартале 2024 года?
  • "Что является первопричиной нашего всплеска продаж?"

Эти вопросы в настоящее время недоступны, так как для них требуются сложные причины, анализ корреляции или внешние факторы, недоступные непосредственно в базе данных. В настоящее время агент данных Fabric не выполняет расширенную аналитику, машинное обучение или вывод причин. Он просто извлекает структурированные данные и обрабатывает их на основе запроса пользователя.

Когда вы задаете вопрос, агент данных Fabric использует API помощника openAI Azure для обработки запроса. Поток работает таким образом:

Доступ к схеме по учетным данным пользователя

Система сначала использует учетные данные пользователя для доступа к схеме источника данных (например, озерохранилище, склад, семантическая модель PBI, базы данных KQL или онтология). Это гарантирует, что система получает сведения о структуре данных, если у пользователя есть разрешение на просмотр.

Создание подсказки

Чтобы интерпретировать вопрос пользователя, система объединяет:

  1. Запрос пользователя: вопрос естественного языка, предоставленный пользователем.
  2. Сведения о схеме: метаданные и структурные сведения источника данных, полученные на предыдущем шаге.
  3. Примеры и инструкции: все предопределенные примеры (например, примеры вопросов и ответов) или конкретные инструкции, предоставляемые при настройке агента данных Fabric. Эти примеры и инструкции помогают уточнить понимание вопроса и направляют ИИ в его взаимодействии с данными.

Вся эта информация используется для создания подсказки. Этот запрос служит в качестве входных данных в API помощника openAI Azure, который ведет себя как агент, лежащий в основе агента данных Fabric. Это по сути указывает агенту данных Fabric о том, как обрабатывать запрос, а также тип ответа для создания.

Вызов инструмента в зависимости от потребностей запроса

Агент анализирует созданный запрос и решает, какой инструмент будет вызываться для получения ответа:

  • Естественный язык в SQL (NL2SQL): используется для создания запросов SQL при расположении данных в озерном хранилище или хранилище.
  • Естественный язык в DAX (NL2DAX): используется для создания запросов DAX для взаимодействия с семантическими моделями в источниках данных Power BI
  • Преобразование естественного языка в KQL (NL2KQL): используется для создания KQL-запросов для извлечения данных из баз данных KQL. NL2KQL может использовать определяемые пользователем функции KQL ,когда они доступны в выбранных базах данных.
  • Microsoft Graph. Используется для запроса данных организации, доступных через Microsoft Graph

Выбранное средство создает запрос с помощью схемы, метаданных и контекста, который предоставляет агент, лежащий в основе агента данных Fabric. Затем средство проверяет запрос, чтобы обеспечить надлежащее форматирование и соответствие своим протоколам безопасности и собственным политикам ответственного ИИ (RAI).

Построение ответов

Агент, базовый агент данных Fabric выполняет запрос и гарантирует, что ответ структурирован и отформатирован соответствующим образом. Агент часто включает дополнительный контекст, чтобы сделать ответ понятным для пользователя. Наконец, ответ отображается пользователю в интерфейсе беседы, как показано на следующем снимке экрана:

Скриншот, показывающий ответ на вопрос агента данных Fabric.

Агент представляет результат и промежуточные шаги, которые он принял для получения окончательного ответа. Этот подход повышает прозрачность и позволяет проверять эти шаги при необходимости. Пользователи могут развернуть раскрывающийся список действий, чтобы просмотреть все действия, которые выполняет агент данных Fabric для получения ответа, как показано на следующем снимке экрана:

Скриншот, показывающий шаги, предпринятые агентом данных Fabric.

Кроме того, агент данных Fabric предоставляет созданный код, используемый для запроса соответствующего источника данных, предоставляя дополнительные сведения о том, как был создан ответ.

Эти запросы предназначены исключительно для запроса данных. Операции, связанные с созданием данных, обновлениями данных, удалением данных, любым типом изменений данных, не допускаются для защиты целостности данных.

В любой момент можно выбрать кнопку "Очистить чат", чтобы очистить чат, как показано на следующем снимке экрана:

Снимок экрана: функция

Функция "Очистить чат" удаляет всю историю чата и запускает новый сеанс. После удаления журнала чата его невозможно получить.

Изменение источника данных

Чтобы удалить источник данных, наведите указатель мыши на имя источника данных в Explorer на левой панели страницы агента данных Fabric, пока не появится меню с тремя точками. Выберите три точки, чтобы отобразить параметры, а затем нажмите кнопку "Удалить ", чтобы удалить источник данных, как показано на следующем снимке экрана:

Снимок экрана: удаление или обновление источников данных.

Кроме того, если источник данных изменился, можно выбрать "Обновить " в том же меню, как показано на следующем снимке экрана:

Снимок экрана: обновление источника данных.

Это гарантирует, что все обновления источника данных отражаются и правильно заполнены в обозревателе, чтобы обеспечить синхронизацию агента данных Fabric с последними данными.

конфигурация агента данных Fabric

Агент данных Fabric предлагает несколько вариантов конфигурации, позволяющих пользователям настраивать поведение агента данных Fabric, чтобы лучше соответствовать потребностям вашей организации. Поскольку агент данных Fabric обрабатывает и представляет данные, эти конфигурации обеспечивают гибкость, которая обеспечивает более широкий контроль над результатами.

Укажите инструкции

Вы можете указать конкретные инструкции по поведению ИИ. Чтобы добавить их в область инструкций агента данных Fabric, выберите инструкции агента Data, как показано на следующем снимке экрана:

Снимок экрана: выбор кнопки инструкций агента данных.

Здесь можно написать до 15 000 символов в простом тексте на английском языке, чтобы указать ИИ о том, как обрабатывать запросы.

Например, можно указать точный источник данных, используемый для определенных типов вопросов. Примеры выбора источника данных могут включать указание ИИ, какой источник данных использовать.

  • Power BI семантические модели для финансовых запросов
  • Озёрный дом данных для данных о продажах
  • база данных KQL для операционных метрик

Эти инструкции гарантируют, что ИИ создает соответствующие запросы, будь то SQL, DAX или KQL, на основе ваших рекомендаций и контекста вопросов.

Если ресурс ИИ последовательно неправильно интерпретирует определенные слова, акронимы или термины, можно попытаться предоставить четкие определения в этом разделе, чтобы убедиться, что ИИ правильно понимает и обрабатывает их. Это особенно полезно для терминологии для конкретного домена или уникального бизнес-жаргона.

С помощью этих инструкций и определения терминов вы повышаете способность ИИ предоставлять точные и соответствующие аналитические сведения в полном соответствии с вашей стратегией данных и бизнес-требованиями.

Укажите примеры запросов

Вы можете повысить точность ответа, предоставив примеры запросов, адаптированных для каждого поддерживаемого источника данных (lakehouse, хранилища, базы данных KQL). Этот подход, известный как few-shot learning в генерируемом ИИ, помогает управлять агентом данных Fabric для создания ответов, которые лучше соответствуют вашим ожиданиям.

При предоставлении ИИ примерами пар запросов и вопросов он ссылается на эти примеры при ответе на будущие вопросы. Сопоставление новых запросов с наиболее актуальными примерами помогает ИИ включать логику для конкретного бизнеса и эффективно отвечать на часто задаваемые вопросы. Эта функция позволяет точно настроить отдельные источники данных и обеспечивает создание более точных запросов SQL или KQL.

Power BI данные семантической модели в настоящее время не поддерживают добавление примеров пар запросов и вопросов. Однако для поддерживаемых источников данных, таких как lakehouse, хранилище и базы данных KQL, дополнительные примеры могут значительно повысить способность ИИ создавать точные запросы, когда его производительность по умолчанию требует корректировки.

Подсказка

Разнообразный набор примеров запросов повышает способность агента данных Fabric создавать точные и соответствующие запросы SQL/KQL. Для баз данных KQL NL2KQL также может использовать определяемые пользователем функции KQL ,которые доступны в выбранных базах данных, поэтому рекомендуется включить примеры запросов, ссылающихся на определяемые пользователем функции.

Чтобы добавить или изменить примеры запросов, нажмите кнопку "Примеры запросов ", чтобы открыть область примеров запросов, как показано на следующем снимке экрана:

Снимок экрана, на котором показано, где можно изменить примеры, предоставляемые ВИ.

Эта область предоставляет параметры для добавления или изменения примеров запросов ко всем поддерживаемым источникам данных, кроме Power BI семантических моделей и онтологий. Для каждого источника данных можно выбрать "Добавить или изменить примеры запросов" для ввода соответствующих примеров, как показано на следующем снимке экрана:

Снимок экрана: примеры SQL, предоставляемые ИИ.

Примечание.

Агент данных Fabric ссылается только на запросы, содержащие допустимый синтаксис SQL/KQL и соответствующие схеме выбранных таблиц. Агент данных Fabric не использует запросы, которые не завершили проверку. Убедитесь, что все примеры запросов действительны и правильно согласованы со схемой, чтобы убедиться, что агент данных Fabric эффективно использует их.

Публикация и предоставление общего доступа к агенту данных Fabric

Проверив производительность агента данных Fabric по различным вопросам, и убедитесь, что он создает точные запросы SQL, DAX или KQL, вы можете поделиться им с коллегами. На этом этапе выберите "Опубликовать", как показано на следующем снимке экрана:

Скриншот, демонстрирующий публикацию агента данных Fabric.

На этом шаге откроется окно, которое запрашивает описание агента данных Fabric. Ниже приведено подробное описание того, что делает агент данных Fabric. Эти подробности помогут вашим коллегам разобраться в функциональных возможностях агента данных Fabric и другим системам и оркестраторам ИИ эффективно вызывать агента данных Fabric.

После публикации агента данных Fabric у вас появятся две версии. Одна из версий — это текущая версия черновика, которую можно продолжать уточнять и улучшать. Вторая версия — опубликованная версия, которую вы можете поделиться своими коллегами, которые хотят запросить агент данных Fabric, чтобы получить ответы на их вопросы. Вы можете включить отзывы коллег в текущую версию черновика при разработке, чтобы повысить производительность агента данных Fabric.

ALM и развертывание

Fabric агенты данных поддерживают возможности управления жизненным циклом, которые помогают управлять агентами в разных средах.

  • Диагностика. Используйте встроенную диагностику для устранения неполадок с поведением агента и выявления проблем с созданием запросов.
  • Интеграция Git: Подключите рабочую область Fabric к репозиторию Git для управления версиями конфигураций агентов, включая инструкции, примеры запросов и выбор источников данных.
  • Конвейеры развертывания: используйте конвейеры развертывания Fabric для повышения уровня агентов данных от разработки до тестовых и производственных рабочих областей.

Примечание.

Потребители, запрашивающие агент данных, использующий Power BI семантические модели, нуждаются только в разрешении на чтение этих моделей и не нуждаются в доступе к рабочей области. Изменение семантической модели или использование таких функций, как подготовка для ИИ, требует разрешения на запись.