Конфиденциальность, безопасность и ответственное использование Copilot в записных книжках и агентах данных Fabric

В этой статье вы узнаете, как работает Microsoft Copilot в записных книжках и агентах данных Fabric (ранее известном как агент данных), о том, как обеспечить безопасность и соответствие бизнес-данным требованиям к конфиденциальности, а также как ответственно использовать генерированный ИИ. Общие сведения об этих разделах для Copilot в Fabric см. в разделе "Конфиденциальность, безопасность и ответственность за использование Copilot (предварительная версия)".

Использование данных

Использование данных в Copilot для цифровых блокнотов на платформе Fabric

  • В записных книжках Copilot может получить доступ только к данным, доступным для текущей записной книжки пользователя, в подключенном Lakehouse или данных, непосредственно загруженных или импортированных в нее пользователем. В блокнотах Copilot не имеет доступа к данным, к которым нельзя получить доступ через блокнот.

  • По умолчанию Copilot имеет доступ к следующим типам данных:

    • Журнал бесед: предыдущие сообщения, отправленные пользователю, и ответы от Copilot. (Дополнительные сведения о хранении журнала бесед см. ниже)
    • Содержимое ячеек, исполненное пользователем.
    • Результаты выполнения ячеек, запущенных пользователем.
    • Схемы источников данных в записной книжке.
    • Пример данных из источников данных в блокноте.
    • Схемы из внешних источников данных в подключенном озерохранилище.

Использование данных в агентах данных Fabric

  • Агенты данных инфраструктуры полагаются на историю бесед пользователя, чтобы лучше отвечать на его вопросы. (Дополнительные сведения о хранении журнала бесед см. ниже)
  • Сведения о схеме добавленных источников данных. Сюда входят имена таблиц и столбцов. (Создатель агента данных выбирает таблицы, которые должны быть включены.)

Управление историей бесед

Для Copilot в записных книжках и агентов данных Fabric мы храним историю бесед в сеансах пользователей.

Почему мы храним журнал бесед и где он хранится?

Чтобы использовать полноценные агентные ИИ в диалоговых взаимодействиях, агент должен сохранять историю общения пользователя в его сеансах для поддержания контекста. Это гарантирует, что агент ИИ сохраняет контекст обсуждений с пользователем из предыдущих сеансов, что обычно является желаемым поведением во многих автономных ИИ взаимодействиях. Такие возможности, как Copilot в записных книжках и агенты данных Fabric, являются опытами ИИ, которые сохраняют историю бесед на протяжении сессий пользователей.

Эта история хранится в пределах границы безопасности Azure в одном регионе и в одном и том же ресурсе Azure OpenAI, обрабатывающих все запросы искусственного интеллекта Fabric. Разница в этом случае заключается в том, что журнал бесед хранится до тех пор, пока пользователь разрешает. Для опыта, который не сохраняет историю бесед в рамках сеансов, данные не хранятся. Запросы обрабатываются только ресурсами Azure OpenAI, которые использует Fabric.

Пользователи могут удалять журнал бесед в любое время, просто очищая чат. Этот параметр доступен как для Copilot в ноутбуках, так и для агентов данных. Если журнал бесед не удаляется вручную, он хранится в течение 28 дней.

Copilot в записных блокнотах: Часто задаваемые вопросы об ответственном ИИ

С помощью Copilot в записных книжках для обработки и анализа и анализа данных в Microsoft Fabric мы предлагаем помощник по искусственному интеллекту для преобразования, изучения и создания решений в контексте записной книжки.

См. соображения и ограничения в Limitations.

Как мы оценили Copilot в записных книжках для обработки и анализа данных?

  • Команда по продукту проверила Copilot, чтобы узнать, насколько хорошо система выполняется в контексте записных книжек, и является ли ответы ИИ аналитическими и полезными.
  • Команда также вложила средства в другие меры по снижению ущерба, включая технологические подходы к сосредоточению результатов работы Copilot на темах, связанных с обработкой данных в области науки о данных.

Как лучше всего работать с Copilot в записных книжках для обработки и анализа данных?

  • Copilot лучше всего оснащен для обработки тем обработки и анализа данных, поэтому ограничьте свои вопросы к этой области.
  • Ясно опишите данные, которые вы хотите, чтобы Copilot проверил. Если вы описываете ресурс данных , например, именовав файлы, таблицы или столбцы. Copilot может скорее получить соответствующие данные и создать полезные выходные данные.
  • Чтобы получить более подробные ответы, загрузите данные в ноутбук в виде DataFrame или закрепите данные в лейкхаусе. Это дает Copilot больше контекста для выполнения анализа. Если актив слишком велик для загрузки, его закрепление — полезная альтернатива.

Агент данных Fabric: часто задаваемые вопросы по ответственному ИИ

Что такое агент данных Fabric?

Агент данных — это новая функция Microsoft Fabric, которая позволяет создавать собственные системы беседы Q&A с помощью генерируемого искусственного интеллекта. Агент данных Fabric делает аналитику данных более доступной и доступной для всех пользователей в организации. С помощью агента данных Fabric ваша команда может беседовать с простыми вопросами на английском языке, о данных, хранящихся в Fabric OneLake, а затем получать соответствующие ответы. Даже люди без технического опыта в ИИ или без глубокого понимания структуры данных могут получать точные и контекстные ответы.

Что может сделать агент данных?

Агент данных Fabric позволяет взаимодействовать с структурированными данными на естественном языке, позволяя пользователям задавать вопросы и получать подробные ответы с учетом контекста. Он позволяет пользователям подключаться и получать аналитические сведения из таких источников данных, как Lakehouse, Warehouse, набор данных Power BI, базы данных KQL без необходимости записывать сложные запросы. Агент данных предназначен для упрощения доступа пользователей к данным и обработки данных, повышая принятие решений через диалоговые интерфейсы, сохраняя контроль над безопасностью и конфиденциальностью данных.

Каковы предполагаемые способы использования агента данных?

  • Агент данных Fabric предназначен для упрощения процесса запроса данных. Он позволяет пользователям взаимодействовать со структурированными данными с помощью естественного языка. Он поддерживает аналитику пользователей, принятие решений и создание ответов на сложные вопросы без необходимости специальных знаний о языке запросов. Агент данных особенно полезен для бизнес-аналитиков, разработчиков решений и других нетехнических пользователей, которым требуются быстрые, практические аналитические сведения из данных, хранящихся в таких источниках, как база данных KQL, Lakehouse, набор данных Power BI и ресурсы хранилища.

  • Агент данных Fabric не предназначен для вариантов использования, когда требуются детерминированные и 100% точные результаты из-за текущих ограничений LLM.

  • Агент данных Fabric не предназначен для вариантов использования, требующих глубокой аналитики или причинной аналитики. Например, "почему номера продаж упали в прошлом месяце?" выходит за рамки текущей области.

  • Агент данных Fabric не предназначен для предоставления рекомендаций по физической или психологической травме. Например, сценарии, которые диагностируют пациентов или назначают лекарства.

  • Агент данных Fabric не предназначен для предоставления консультаций по возможностям жизни или юридическому статусу. Примеры включают в себя сценарии, в которых система ИИ может повлиять на правовое состояние человека, юридические права или доступ к кредитам, финансам, образованию, здравоохранению, здравоохранению, страхованию, социальному обеспечению, услугам, возможностям или условиям, на которые они предоставляются.

Как оценивался агент данных Fabric? Какие метрики используются для измерения производительности?

Команда по продукту проверила агент данных на различных общедоступных и частных тестах, чтобы определить качество запроса для различных источников данных. Команда также инвестировала в другие способы устранения вреда, включая технологические подходы, чтобы гарантировать, что выходные данные агента данных ограничены контекстом выбранных источников данных.

Каковы ограничения агента данных Fabric? Как пользователи могут свести к минимуму влияние ограничений агента данных Fabric при использовании системы?

  • Убедитесь, что используются описательные имена столбцов. Вместо имен столбцов C1 или ActCu (например, используйте ActiveCustomer или IsCustomerActive). Это самый эффективный способ получить более надежные запросы из ИИ.

  • Чтобы повысить точность агента данных Fabric, можно предоставить больше контекста с инструкциями агента данных и примерами запросов. Эти входные данные помогают API Azure OpenAI Assistant, который управляет агентом данных Fabric, принимать более обоснованные решения о том, как интерпретировать вопросы пользователей и какой источник данных наиболее подходит для использования.

  • Инструкции агента данных можно использовать для руководства по поведению базового агента, помогая ему определить лучший источник данных для ответа на определенные типы вопросов.

  • Вы также можете предоставить примеры пар вопросов и запросов, чтобы продемонстрировать, как агент данных Fabric должен реагировать на распространенные запросы. Эти примеры служат шаблонами для интерпретации аналогичных входных данных пользователей и создания точных результатов. Примеры пар запросов к вопросу в настоящее время не поддерживаются для источников данных семантической модели Power BI.

  • Полный список текущих ограничений агента данных см. в этом ресурсе .

Какие операционные факторы и параметры позволяют эффективно и ответственно использовать агент данных Fabric?

  • Агент данных Fabric может получить доступ только к предоставленным данным. Она использует схему (имя таблицы и имя столбца), а также инструкции агента данных Fabric и примеры запросов, предоставляемых в пользовательском интерфейсе или пакете SDK.

  • Агент данных Fabric может получить доступ только к данным, к которым пользователь может получить доступ. При использовании агента данных учетные данные используются для доступа к базовой базе данных. Если у вас нет доступа к базовым данным, агент данных не может получить доступ к этим базовым данным. Это верно при использовании агента данных в разных каналах, например Microsoft Foundry или Microsoft Copilot Studio, где другие пользователи могут использовать агент данных.