Поделиться через


Данные, конфиденциальность и безопасность для моделей Azure Direct в Azure AI Foundry

Important

Для удобства предоставляются только переводы, отличные от английского языка. Ознакомьтесь с EN-US версией этого документа для окончательной версии.

В этой статье содержатся сведения о том, как данные, предоставляемые вами в Azure Direct Models в Azure AI Foundry, обрабатываются, используются и хранятся. Azure Direct Model означает модель ИИ, назначенную и развернутую как "Прямую модель Azure" в Azure AI Foundry, и включает модели Azure OpenAI. Azure Direct Models хранит и обрабатывает данные для предоставления службы и отслеживания использования, которые нарушают применимые условия продукта. Также см. Дополнение к защите данных от продуктов и служб Майкрософт, которое регулирует обработку данных Azure Direct Models. Azure AI Foundry — это служба Azure; Узнайте больше о применимых предложениях по соответствию Требованиям Azure.

Important

Ваши запросы (входные данные) и завершения (выходные данные), внедренные и обучающие данные:

  • недоступны для других клиентов.
  • недоступен для OpenAI или других поставщиков моделей Azure Direct.
  • не используется поставщиками моделей Azure Direct для улучшения моделей или служб.
  • не используются для обучения любых базовых моделей генеративного ИИ без вашего согласия или указаний.

Ваши точно настроенные модели Azure Direct доступны исключительно для использования.

Azure AI Foundry — это служба Azure; Корпорация Майкрософт размещает прямые модели Azure в среде Azure и Azure Direct Models не взаимодействуют со службами, управляемыми поставщиками моделей Azure Direct, например OpenAI (например, ChatGPT или API OpenAI).

Какие данные обрабатывает Azure AI Foundry для предоставления моделей Azure Direct?

Azure AI Foundry обрабатывает следующие типы данных для предоставления Azure Direct Models:

  • Запросы и сгенерированное содержимое. Когда пользователем отправляются запросы, контент генерируется службой с помощью операций создания, создания чатов, изображений и встраиваний.
  • Отправленные данные. Вы можете передать собственные данные для использования с определенными функциями службы (например, тонкой настройкой, API помощников, пакетной обработкой) с помощью API файлов или векторного хранилища.
  • Данные для автоматически управляемых сущностей. При использовании некоторых не обязательных функций Azure Direct Models и агентов, таких как API ответов, функция потоков в API помощников и хранение завершений, служба создает хранилище данных для сохранения истории сообщений и другого содержимого в соответствии с тем, как настроена эта функция.
  • Дополненные с помощью запросов данные. При использовании данных, связанных с сущностями с сохранением состояния, служба извлекает релевантные данные из настроенного хранилища данных и дополняет запрос для получения выводов, обоснованных вашими данными. Запросы также могут быть дополнены данными, полученными из источника, включенного в сам запрос, например URL-адрес.
  • Обучающие и валидирующие данные. Вы можете предоставить собственные данные обучения, состоящие из пар «запрос-ответ», для точной настройки модели.

Как Azure AI Foundry обрабатывает данные для предоставления прямых моделей Azure?

На схеме ниже показано, как обрабатываются данные. На этой схеме рассматривается несколько типов обработки:

  1. Как Azure AI Foundry обрабатывает ваши запросы с использованием технологии вывода Azure Direct Models для генерации контента, включая случаи, когда дополнительные данные из указанного источника данных добавляются в запрос с помощью Azure OpenAI на ваших данных, Ассистентов или пакетной обработки.
  2. Как функция Помощников сохраняет данные в связи с сообщениями, потоками и запусками.
  3. Как функция API ответов хранит данные для сохранения журнала сообщений.
  4. Как функция пакетной обработки обрабатывает ваши отправленные данные.
  5. Как Azure AI Foundry создает настраиваемую модель с вашими загруженными данными.
  6. Как Azure AI Foundry и персонал Microsoft анализируют запросы и сгенерированный контент (тексты и изображения) на наличие вредного содержимого и закономерностей, которые указывают на использование службы в нарушение кодекса поведения или других применимых условий продукта.

Схема потока данных для службы.

Как показано на схеме выше, клиенты с управляемыми услугами могут подать заявку на изменение мониторинга злоупотреблений.

Генерация текстов, изображений или эмбеддингов через вывод данных

Модели Azure Direct (базовые или точно настроенные), развернутые в вашем ресурсе Azure AI Foundry, обрабатывают входные запросы и создают ответы с текстом, изображениями или встраиваниями. Взаимодействия клиентов с моделью логически изолированы и защищены с помощью технических мер, включая, но не ограничиваясь транспортным шифрованием TLS1.2 или более поздней версии, периметром безопасности вычислений, токенизацией текста и исключительным доступом к выделенной памяти GPU. Запросы и завершения оцениваются в режиме реального времени для вредных типов контента, а создание контента фильтруется на основе настроенных пороговых значений. Дополнительные сведения см. в обзоре фильтрации содержимого.

Запросы и ответы обрабатываются в пределах указанного клиентом географического региона (если вы не используете глобальный или тип развертывания DataZone), но могут обрабатываться между регионами в географическом регионе для операционных целей (включая управление производительностью и емкостью). Дополнительные сведения о расположении обработки при использовании типа развертывания Global или DataZone см. ниже.

Модели без отслеживания состояния: в модели не хранятся запросы или завершения. Кроме того, запросы и завершения не применяются для обучения, переобучения или улучшения базовых моделей.

Общие сведения о расположении обработки для типов развертывания "Глобальный" и "Зона данных"

Помимо стандартных развертываний, Azure AI Foundry предлагает варианты развертывания Azure Direct Model, помеченные как Global и DataZone. Для любого типа развертывания с меткой "Глобальный", запросы и ответы могут обрабатываться в любом географическом регионе, где развернута соответствующая модель Azure Direct (дополнительные сведения о доступности регионов моделей). Для любого типа развертывания, помеченного как DataZone, запросы и ответы могут обрабатываться в любой географической области в пределах указанной зоны данных, как определено корпорацией Майкрософт. Если вы создаете развертывание DataZone в ресурсе Azure AI Foundry, расположенном в США, запросы и ответы могут обрабатываться в любом месте США. Если вы создаете развертывание DataZone в ресурсе Azure AI Foundry, расположенном в стране-члене Европейского союза, запросы и ответы могут быть обработаны в той или иной стране-члене Европейского союза. Для типов развертывания Global и DataZone все данные, сохраняемые в состоянии покоя, такие как загруженные данные, а также хранилище данных мониторинга злоупотреблений, созданное для развертываний Global и DataZone, хранятся в географическом регионе, определенном клиентом. Влияет только расположение обработки, если клиент использует глобальный тип развертывания или тип развертывания DataZone в Azure Direct Models; Обязательства по обработке и соответствию данным Azure остаются применимыми.

Дополнение запросов для привязки созданных результатов к вашим данным.

Функция Azure OpenAI "на основе ваших данных" позволяет подключать источники данных, чтобы связывать их с созданными результатами на основе ваших данных. Данные сохраняются в источнике данных и указанном расположении; Azure OpenAI не создает дубликат хранилища данных. При получении запроса пользователя служба извлекает соответствующие данные из подключенного источника данных и расширяет запрос. Модель обрабатывает этот расширенный запрос и возвращает созданное содержимое, как описано выше. Узнайте больше о том, как безопасно использовать функцию On Your Data.

Хранилище данных для функций Azure Direct Models

Некоторые функции Azure Direct Models хранят данные в службе. Эти данные загружаются клиентом с помощью API файлов или векторного хранилища или автоматически сохраняются в связи с определенными сущностями, отслеживающими состояние, такими как API Ответов, функция потоков в API Помощников и Хранимые Завершения. Данные, хранящиеся для таких функций:

  • Хранится в состоянии покоя в ресурсе Azure AI Foundry в арендаторе Azure клиента в том же географическом регионе, как и ресурс.
  • Данные всегда зашифрованы на месте с использованием шифрования AES-256 от Microsoft по умолчанию, с возможностью использования ключа, управляемого пользователем (некоторые функции предварительной версии могут не поддерживать такие ключи). Ключи, управляемые корпорацией Майкрософт, всегда используются для обеспечения базового шифрования для всех сохраненных данных.
  • Может быть удален клиентом в любое время.

Note

Модели или функции в предварительной версии могут не поддерживать все указанные выше условия.

Сохраненные данные могут использоваться со следующими функциями и возможностями службы:

  • Создание настраиваемой (точно настроенной) модели. Узнайте больше о том, как работает тонкая настройка. Точно настроенные модели доступны исключительно клиенту, данные которого использовались для создания точно настроенной модели, зашифрованы в состоянии покоя, когда они не развернуты для выполнения выводов, и могут быть удалены клиентом в любое время. Обучающие данные, отправленные для тонкой настройки, не используются для обучения базовых моделей генеративного ИИ без вашего разрешения или инструкции.
  • Пакетная обработка. Узнайте больше о том, как работает пакетная обработка. Пакетная обработка — это глобальный тип развертывания; данные, хранящиеся в состоянии покоя, остаются в указанном регионе Azure, пока не станет доступна мощность обработки; обработка может происходить в любом регионе, где развернута соответствующая модель Azure Direct (дополнительные сведения о доступности регионов моделей).
  • API ответов. Узнайте больше о том, как работает API ответов . Этот API хранит журнал сообщений и другое содержимое, связанное с журналом сообщений. Это необходимо для многоэтапных бесед и рабочих процессов.
  • API помощников (предварительная версия). Узнайте больше о том, как работает API Помощников. Некоторые функции помощников, такие как потоки, хранят историю сообщений и другое содержимое.
  • Сохранённые завершения (предварительная версия). Сохраненные завершения хранят пары входных и выходных данных из моделей Azure OpenAI, развернутых клиентом, таких как GPT-4o, через API завершения чата, и отображают эти пары на портале Azure AI Foundry. Это позволяет клиентам создавать наборы данных с их производственными данными, которые затем можно использовать для оценки или точной настройки моделей (как разрешено в применимых условиях продукта).

Предотвращение злоупотреблений

Чтобы снизить риск жестокого или вредного использования, Azure Direct Models включает функции мониторинга злоупотреблений. Дополнительные сведения о мониторинге злоупотреблений см. в разделе мониторинга злоупотреблений.

Оценки безопасности точно настроенных моделей оценивают точно настроенную модель для потенциально опасных ответов с помощью метрик риска и безопасности Azure. Только результирующая оценка (развертываемая или неразвертываемая) регистрируется в службе.

Система мониторинга злоупотреблений в azure Direct Models предназначена для обнаружения и устранения повторяющихся экземпляров повторяющегося содержимого и (или) поведения, которые позволяют использовать службу таким образом, что может нарушать кодекс поведения или другие применимые условия продукта. Как описано здесь, система использует алгоритмы и эвристики для обнаружения индикаторов потенциальных злоупотреблений. При обнаружении этих индикаторов может быть выбран образец запросов и завершений клиента для проверки. Проверка проводится автоматизированными средствами, включая модели ИИ, такие как LLM по умолчанию, с дополнительными проверками со стороны рецензентов по мере необходимости. Подробные сведения об автоматизированной проверке и проверке человека доступны в мониторинге злоупотреблений.

Для автоматической проверки запросы и завершения клиента не хранятся системой или используются для обучения моделей ИИ или других систем. Хранилище данных мониторинга злоупотреблений, в котором хранятся подсказки и результаты выполнения для проверки человеком, логически разделено по ресурсам клиента (каждый запрос включает идентификатор ресурса клиента Azure AI Foundry). Отдельное хранилище данных находится в каждом географическом регионе, в котором доступна модель Azure Direct, и запросы клиента и созданное содержимое хранятся в географическом регионе Azure, где развернут ресурс Azure AI Foundry клиента в пределах границы службы Прямых моделей Azure. Рецензенты, оценивая потенциальные злоупотребления, могут получить доступ к данным о запросах и ответах только в том случае, если эти данные уже помечены системой мониторинга злоупотреблений, или когда запросы и ответы являются частью потенциально злоупотребляющих шаблонов использования. Рецензенты пользователей являются авторизованными сотрудниками Майкрософт, которые получают доступ к данным с помощью точечных запросов с помощью идентификаторов запросов, рабочих станций secure Access (SAWs) и JIT-In-Time (JIT) запроса на утверждение, предоставленное менеджерами команд. Для моделей Azure Direct, развернутых в Европейской экономической зоне, авторизованные сотрудники Майкрософт находятся в Европейской экономической зоне.

Если клиент был утвержден для адаптированного мониторинга злоупотреблений (дополнительные сведения о мониторинге злоупотреблений), хранилище данных и процесс человеческой проверки, описанный выше, не выполняется. Однако автоматическая проверка по-прежнему может выполняться, используя алгоритмы, включая модели искусственного интеллекта, которые анализируют запросы и завершения в момент их предоставления или создания, в зависимости от обстоятельств. Если такая автоматическая проверка обнаруживает содержимое, потенциально указывающее на серьезные или повторяющиеся злоупотребления в подписке клиента, клиент может быть подвержен ограничениям доступа, как указано в условиях продукта для ответственного использования служб Искусственного интеллекта Майкрософт. От клиента могут попросить согласия на мониторинг злоупотреблений с проверкой, осуществляемой человеком, чтобы снизить риск будущих ограничений на доступ (например, ограничения или приостановки учетной записи или подписки при обнаружении злоупотребления).

Note

Функции предварительной версии Azure, включая модели Azure Direct в предварительной версии, могут использовать различные методики конфиденциальности, в том числе в отношении мониторинга злоупотреблений. Предварительные версии могут применяться к дополнительным условиям: дополнительные условия использования для предварительных версий Microsoft Azure.

Предотвращение создания вредного содержимого

Прямые модели Azure включают систему, предназначенную для обнаружения и предотвращения выходных данных вредного содержимого. Дополнительные сведения о фильтрации содержимого см. в разделе "Фильтрация содержимого".

Фильтрация содержимого выполняется синхронно, так как процессы службы запрашивают создание содержимого, как описано выше и здесь. Запросы или созданные содержимое не хранятся в моделях классификатора содержимого, а запросы и выходные данные не используются для обучения моделей создания ИИ без вашего разрешения или инструкции.

Как клиент может проверить, отключено ли хранилище данных для мониторинга злоупотреблений?

Существует два способа для клиентов, после получения одобрения на отключение мониторинга злоупотреблений, убедиться, что хранилище данных для мониторинга злоупотреблений было отключено в вашей подписке Azure:

  • Использование портала Azure или
  • Azure CLI (или любой API управления).

Note

Значение false для атрибута ContentLogging отображается только в том случае, если хранилище данных для мониторинга злоупотреблений отключено. В противном случае это свойство не будет отображаться на портале Azure или в выходных данных Azure CLI.

Prerequisites

  1. Вход в Azure
  2. Выберите подписку Azure, в которой размещен ресурс Azure AI Foundry.
  3. Перейдите на страницу обзора ресурса Azure AI Foundry.
  1. Перейдите на страницу обзора ресурсов

  2. Щелкните ссылку Просмотр JSON в правом верхнем углу, как показано на изображении ниже.

    Представление JSON статуса журнала на портале Azure.

В списке возможностей будет отображаться значение "ContentLogging", которое будет отображаться и иметь значение FALSE при отключении ведения журнала для мониторинга злоупотреблений.

{ 
    "name":"ContentLogging",
    "value":"false"
}

Дополнительные сведения о конфиденциальности и безопасности корпорации Майкрософт см. в Центре управления безопасностью Майкрософт.

Журнал изменений

Date Changes
3 октября 2025 г. Расширение документа в Azure Direct Models; фильтрация содержимого и мониторинг злоупотреблений разделены; добавлены пояснения относительно мониторинга злоупотреблений и случаев серьезного или повторяющегося злоупотребления.
17 декабря 2024 г. Добавлена информация об обработке и хранении данных в связи с новым компонентом хранимых завершений; добавлен язык, уточняющий, что функции Azure OpenAI в предварительной версии могут не поддерживать все условия хранения данных; Удалено обозначение "предварительная версия" для пакетной обработки
18 ноября 2024 г. Добавлена информация о процессе обработки данных для новых типов развертывания "Зона данных"; добавлена информация о новой проверке ИИ запросов и завершений в целях предотвращения злоупотреблений и генерации вредного содержимого.
4 сентября 2024 г. Добавлена информация (и изменён существующий текст соответствующим образом) об обработке данных для новых функций, включая API помощников (предварительная версия), Batch (предварительная версия) и глобальные развертывания; внесены изменения касательно расположения обработки данных в соответствии с принципами расположения данных Azure; добавлена информация об обработке данных для оценки безопасности настроенных моделей; уточнение обязательств, связанных с использованием запросов и завершений; незначительные изменения для улучшения ясности.
23 июня 2023 г. Добавлена информация об обработке данных для новой функции Azure в вашей функции данных; Удалены сведения о мониторинге злоупотреблений, которые теперь доступны в мониторинге злоупотреблений в Службе OpenAI Azure. Добавлена сводная заметка. Обновлено и оптимизировано содержимое и обновлены схемы для дополнительной ясности. добавлен журнал изменений

См. также