Поделиться через


Конфиденциальность, безопасность и ответственное использование Copilot в рабочей нагрузке обработки и анализа данных

В этой статье вы узнаете, как работает Microsoft Copilot для обработки и анализа данных, как обеспечить безопасность и соответствие бизнес-данным требованиям к конфиденциальности, а также о том, как ответственно использовать генерированный ИИ. Общие сведения об этих разделах для Copilot в Fabric см. в разделе "Конфиденциальность, безопасность и ответственность за использование Copilot (предварительная версия)".

С помощью Copilot для обработки и анализа данных в Microsoft Fabric и других функций создания ИИ в предварительной версии Microsoft Fabric предлагает новый способ преобразования и анализа данных, создания аналитических сведений и отчетов в области обработки и анализа данных и других рабочих нагрузок.

См. соображения и ограничения в Limitations.

Использование данных Copilot для обработки и анализа данных

  • В записных книжках Copilot может получить доступ только к данным, доступным для текущей записной книжки пользователя, в подключенном Lakehouse или данных, непосредственно загруженных или импортированных в нее пользователем. В записных книжках Copilot не может получить доступ к данным, недоступным для записной книжки.

  • По умолчанию Copilot имеет доступ к следующим типам данных:

    • Предыдущие сообщения, отправленные этому пользователю в этом сеансе и ответы от Copilot.
    • Содержимое ячеек, исполненное пользователем.
    • Результаты выполнения ячеек, запущенных пользователем.
    • Схемы источников данных в записной книжке.
    • Пример данных из источников данных в блокноте.
    • Схемы из внешних источников данных в подключенном озерохранилище.

Оценка Copilot для обработки и анализа данных

  • Команда по продукту проверила Copilot, чтобы узнать, насколько хорошо система выполняется в контексте записных книжек, и является ли ответы ИИ аналитическими и полезными.
  • Команда также вложила средства в другие меры по снижению ущерба, включая технологические подходы к сосредоточению результатов работы Copilot на темах, связанных с обработкой данных в области науки о данных.

Советы по работе с Copilot для обработки и анализа данных

  • Copilot лучше всего оснащен для обработки тем обработки и анализа данных, поэтому ограничьте свои вопросы к этой области.
  • Ясно опишите данные, которые вы хотите, чтобы Copilot проверил. Если вы описываете ресурс данных , например, именовав файлы, таблицы или столбцы. Copilot может скорее получить соответствующие данные и создать полезные выходные данные.
  • Чтобы получить более подробные ответы, загрузите данные в ноутбук в виде DataFrame или закрепите данные в лейкхаусе. Это дает Copilot больше контекста для выполнения анализа. Если актив слишком велик для загрузки, его закрепление — полезная альтернатива.

Агент данных Fabric: часто задаваемые вопросы по ответственному ИИ

Что такое агент данных Fabric?

Агент данных — это новая функция Microsoft Fabric, которая позволяет создавать собственные системы беседы Q&A с помощью генерируемого искусственного интеллекта. Агент данных Fabric делает аналитику данных более доступной и доступной для всех пользователей в организации. С помощью агента данных Fabric ваша команда может беседовать с простыми вопросами на английском языке, о данных, хранящихся в Fabric OneLake, а затем получать соответствующие ответы. Даже люди без технического опыта в ИИ или без глубокого понимания структуры данных могут получать точные и контекстные ответы.

Что может сделать агент данных?

Агент данных Fabric позволяет взаимодействовать с структурированными данными на естественном языке, позволяя пользователям задавать вопросы и получать подробные ответы с учетом контекста. Он позволяет пользователям подключаться и получать аналитические сведения из таких источников данных, как Lakehouse, Warehouse, набор данных Power BI, базы данных KQL без необходимости записывать сложные запросы. Агент данных предназначен для упрощения доступа пользователей к данным и обработки данных, повышая принятие решений через диалоговые интерфейсы, сохраняя контроль над безопасностью и конфиденциальностью данных.

Каковы предполагаемые способы использования агента данных?

  • Агент данных предназначен для упрощения процесса запроса данных. Он позволяет пользователям взаимодействовать со структурированными данными с помощью естественного языка. Он поддерживает аналитику пользователей, принятие решений и создание ответов на сложные вопросы без необходимости специальных знаний о языке запросов. Агент данных особенно полезен для бизнес-аналитиков, разработчиков решений и других нетехнических пользователей, которым требуются быстрые, практические аналитические сведения из данных, хранящихся в таких источниках, как база данных KQL, Lakehouse, набор данных Power BI и ресурсы хранилища.

  • Агент данных не предназначен для вариантов использования, когда требуются детерминированные и 100% точные результаты из-за текущих ограничений LLM.

  • Агент данных не предназначен для вариантов использования, требующих глубокой аналитики или причинной аналитики. Например, "почему номера продаж упали в прошлом месяце?" находится вне текущей области.

Как оценивался агент данных? Какие метрики используются для измерения производительности?

Команда по продукту проверила агент данных на различных общедоступных и частных тестах, чтобы определить качество запроса для различных источников данных. Команда также инвестировала в другие способы устранения вреда, включая технологические подходы, чтобы гарантировать, что выходные данные агента данных ограничены контекстом выбранных источников данных.

Каковы ограничения агента данных? Как пользователи могут свести к минимуму влияние ограничений агента данных при использовании системы?

  • Убедитесь, что используются описательные имена столбцов. Вместо имен столбцов C1 или ActCu (например, используйте ActiveCustomer или IsCustomerActive). Это самый эффективный способ получить более надежные запросы из ИИ.

  • Чтобы повысить точность агента данных Fabric, можно предоставить больше контекста с инструкциями агента данных и примерами запросов. Эти входные данные помогают API Ассистента Azure OpenAI, который управляет агентом данных Fabric, принимать более лучшие решения о том, как интерпретировать вопросы пользователя и какой источник данных наиболее подходит для использования.

  • Инструкции агента данных можно использовать для руководства по поведению базового агента, помогая ему определить лучший источник данных для ответа на определенные типы вопросов.

  • Вы также можете предоставить примеры пар вопросов и запросов, чтобы продемонстрировать, как агент данных Fabric должен реагировать на распространенные запросы. Эти примеры служат шаблонами для интерпретации аналогичных входных данных пользователей и создания точных результатов. Примеры пар запросов к вопросу в настоящее время не поддерживаются для источников данных семантической модели Power BI.

  • Полный список текущих ограничений агента данных см. в этом ресурсе .

Какие операционные факторы и параметры позволяют эффективно и ответственно использовать агент данных Fabric?

  • Агент данных может получить доступ только к предоставленным данным. Она использует схему (имя таблицы и имя столбца), а также инструкции агента по обработке данных и примеры запросов, которые вы предоставили в пользовательском интерфейсе или через пакет SDK.

  • Агент данных может получить доступ только к данным, к которым пользователь может получить доступ. При использовании агента данных учетные данные используются для доступа к базовой базе данных. Если у вас нет доступа к базовым данным, агент данных не может получить доступ к этим базовым данным. Это верно при использовании агента данных в разных каналах, например Azure AI Foundry или Microsoft Copilot Studio, где другие пользователи могут использовать агент данных.