Поделиться через


Обнаружение защищенных материалов

API обнаружения защищенных материалов сканируют выходные данные больших языковых моделей, чтобы определить и пометить известный защищенный материал. API-интерфейсы предназначены для предотвращения создания содержимого, которое тесно соответствует тексту или коду авторских прав.

API Защищенного материала отмечает известное текстовое содержимое (например, текст песни, статьи, рецепты и выбранный веб-контент), которое может выводиться большими языковыми моделями.

API защищенного кода указывает на защищенное содержимое программного кода (из известных репозиториев GitHub, включая библиотеки программного обеспечения, исходный код, алгоритмы и другое закрытое содержимое программирования), которое может быть сгенерировано большими языковыми моделями.

Внимание

Сканер и индексатор кода службы безопасности содержимого актуальны только до 6 апреля 2023 г. Код, добавленный в GitHub после этой даты, не будет обнаружен. Используйте собственное усмотрение при использовании защищенного материала кода для обнаружения последних фрагментов кода.

Обнаруживая и предотвращая отображение защищенного материала, организации могут обеспечить соответствие законам интеллектуальной собственности, поддерживать оригинальность содержимого и защищать свою репутацию.

В этом руководстве содержатся сведения о типах контента, обнаруженных защищенным API материалов.

Сценарии пользователей

Платформы создания контента для творческого письма

  • Сценарий: платформа создания контента, использующая генерированный ИИ для творческого написания (например, записи блога, истории, маркетинговая копия) интегрирует функцию защищенного материала для текста, чтобы предотвратить создание содержимого, которое тесно соответствует известному авторскому материалу.
  • Пользователь: администраторы платформы и создатели содержимого.
  • Действие. Платформа использует безопасность содержимого ИИ Azure для сканирования содержимого, созданного ИИ, прежде чем он будет предоставлен пользователям. Если созданный текст соответствует защищенному материалу, содержимое помечается и блокируется или пересматривается.
  • Результат: платформа избегает потенциальных нарушений авторских прав и гарантирует, что все созданное содержимое является оригинальным и соответствует законам об интеллектуальной собственности.

Автоматическое создание контента социальных сетей

  • Сценарий: агентство цифрового маркетинга использует созданный ИИ для автоматизации создания контента социальных сетей. Агентство интегрирует функцию "Защищенный материал для текста", чтобы избежать публикации содержимого, созданного ИИ, которое включает в себя авторские права, например текст песни или фрагменты из книг.
  • Цифровые маркетологи и менеджеры социальных сетей.
  • Действие. Агентство использует Azure AI Content Safety для проверки всех содержимого социальных сетей, созданных ИИ, для совпадений с базой данных защищенного материала. Содержимое, которое соответствует, помечается для изменения или заблокировано для публикации.
  • Результат: агентство поддерживает соответствие законам об авторских правах и избегает рисков репутации, связанных с размещением несанкционированного содержимого.

Написание новостей с поддержкой ИИ

  • Сценарий: новостной канал использует генерированный ИИ для помощи журналистам в разработке статей и отчетов. Чтобы предотвратить непреднамеренное копирование защищенных новостных статей или других материалов, охраняемых авторским правом, средство массовой информации использует функцию защищенного материала для текста.
  • Пользователь: журналисты, редакторы и сотрудники по соответствию требованиям.
  • Действие: Новостное агентство интегрирует Безопасность содержимого ИИ Azure в рабочий процесс создания контента. Созданные искусственным интеллектом черновики автоматически проверяются на защищенное содержимое перед отправкой для редактирования.
  • Результат: новостной канал предотвращает случайные нарушения авторских прав и поддерживает целостность и оригинальность его отчетности.

Платформы e-learning с использованием ИИ для создания контента

  • Сценарий: платформа электронного обучения использует генерированный ИИ для создания учебного содержимого, например сводок, тестов и пояснительных текстов. Платформа использует функцию "Защищенный материал для текста", чтобы гарантировать, что созданное содержимое не включает защищенный материал из учебников, статей или академических статей.
  • Пользователь: создатели содержимого для образовательных учреждений и сотрудники по соответствию требованиям.
  • Действие. Платформа интегрирует функцию для сканирования учебных материалов, созданных ИИ. Если любое содержимое соответствует известному защищенному академическому материалу, оно помечается для изменения или автоматически удаляется.
  • Результат: платформа поддерживает качество содержимого образования и соответствует законам об авторских правах, избегая использования защищенного материала в ресурсах обучения, созданных ИИ.

Генераторы рецептов с использованием искусственного интеллекта

  • Сценарий: веб-сайт продуктов питания и рецептов использует генерирующий ИИ для создания новых рецептов на основе предпочтений пользователей. Чтобы избежать создания содержимого, соответствующего защищенным рецептам из известных книг или веб-сайтов, веб-сайт интегрирует функцию защищенного материала для текста.
  • Пользователь: диспетчеры содержимого и администраторы платформы.
  • Действие. Веб-сайт использует безопасность содержимого ИИ Azure для проверки рецептов, созданных ИИ, в базе данных известного защищенного содержимого. Если созданный рецепт соответствует защищенному, он помечен и изменен или заблокирован.
  • Результат: веб-сайт гарантирует, что все созданные искусственным интеллектом рецепты являются оригинальными, что снижает риск нарушения авторских прав.

Примеры текста защищенного материала

Дополнительные сведения о основных категориях обнаружения защищенного текста см. в этой таблице. При вызове API применяются все четыре категории.

Категория Область Считается приемлемым Считается вредным
Рецепты Содержимое, защищенное авторским правом, связанное с рецептами.

Другие вредные или конфиденциальные тексты выходят за рамки этой задачи, если только они не пересекаются с вредом IP-прав на рецепты.
  • Ссылки на веб-страницы, содержащие сведения о рецептах
  • Любое содержимое из рецептов, у которых нет или низкой защиты IP/авторских прав:
    • Списки ингредиентов
    • Основные инструкции по объединению и приготовлению ингредиентов
  • Отклонение или отказ в предоставлении содержимого, защищенного авторским правом:
    • Изменение раздела, чтобы избежать предоставления общего доступа к содержимому, защищенному авторским правом
    • Отказ от совместного использования содержимого, защищенного авторским правом
    • Предоставление неответственных сведений
  • Другое литературное содержимое в рецепте
    • Сопоставление анекдотов, историй или личных комментариев о рецепте (40 символов или больше)
    • Творческие названия рецепта, которые не ограничиваются хорошо известным именем блюда или простым описательным сведением блюда, указывающим, какой ингредиент является основным (не менее 40 символов)
    • Творческие описания ингредиентов или шагов для объединения или приготовления ингредиентов, включая описания, содержащие больше информации, чем необходимо для создания блюда, полагаться на нечеткое слово или содержать ненормативную лексику (40 символов или более)
  • Методы доступа к содержимому, защищенному авторским правом:
    • Способы обхода платных барьеров для получения доступа к рецептам
Веб-содержимое Все веб-сайты, у которых webmd.com является именем домена в URL-адресе. Основное внимание уделяется только вопросам, связанным с защищенным авторским правом содержимым выбранного веб-контента.

Другой вредоносный или конфиденциальный текст не входит в рамки этой задачи, если он не пересекается с вредом от определенного контента.
  • Ссылки на веб-страницы
  • Короткие выдержки или фрагменты выбранного веб-контента, если:
    • Они относятся к запросу пользователя
    • Они меньше 200 символов
  • Существенное содержимое выбранного веб-содержимого
    • Разделы ответа длиной более 200 символов, которые имеют существенное сходство с блоком текста из выбранного веб-содержимого
    • Фрагменты из выбранного веб-содержимого, которые длиннее 200 символов
    • Цитаты из выбранного веб-контента длиной более 200 символов
  • Методы доступа к содержимому, защищенному авторским правом:
    • Способы обхода paywalls или защиты DRM для доступа к защищенному веб-содержимому
Новости Сосредоточьтесь только на проблемах авторского контента в отношении новостей.

Другие вредные или конфиденциальные тексты не рассматриваются в рамках этой задачи, если это не пересекается с нарушением авторских прав на новостной контент.
  • Ссылки на веб-страницы, в которых размещаются новости или сведения о новостях, журналах или статьях блога до тех пор, пока:
    • У них есть допустимые разрешения
    • У них есть лицензированное освещение новостей
    • Они являются авторизованными платформами
  • Ссылки на авторизованные веб-страницы, содержащие внедренные аудио/видео проигрыватели, при условии:
    • У них есть допустимые разрешения
    • У них есть лицензированное освещение новостей
    • Они являются авторизованными платформами потоковой передачи
    • Это официальные каналы YouTube
  • Короткие фрагменты, такие как заголовки или подписи из новостных статей, до тех пор:
    • Они относятся к запросу пользователя
    • Они не являются существенной частью статьи
    • Они не являются всей статьей
  • Сводка новостей до тех пор, пока:
    • Это относится к запросу пользователя
    • Это краткое и фактическое
    • Она не копирует или парафразирует значительную часть статьи
    • Он чётко и явно обозначен как сводка
  • Анализ/критика/обзор новостных статей при условии, что:
    • Это относится к запросу пользователя
    • Это краткое и фактическое
    • Она не копирует или парафразирует значительную часть статьи
    • Ясно и заметно цитируется как анализ/критика/обзор
  • Любое содержимое новостей без защиты IP/авторских прав:
    • Новости,журналы/блоги, которые находятся в общественном домене
    • News/Magazines/Blogs, для которых защита авторских прав истекла, была отказана или никогда не существовала
  • Отклонение или отказ в предоставлении содержимого, защищенного авторским правом:
    • Изменение раздела, чтобы избежать общего доступа к содержимому, защищенному авторским правом
    • Отказ от совместного использования содержимого, защищенного авторским правом
    • Предоставление неответственных сведений
  • Ссылки на pdf-файл или любой другой файл, содержащий полный текст статей новостей, журналов или блогов, если только не:
    • Они создаются на авторизованных платформах с законными разрешениями и лицензиями
  • Содержимое новостей
    • Более 200 символов, взятых из любой новостной статьи
    • Более 200 символов существенно похожи на блок текста из любой новостной статьи
    • Прямой доступ к статьям новостей, журналов и блогов, которые находятся за платными стенами.
  • Методы доступа к содержимому, защищенному авторским правом:
    • Шаги по скачиванию новостей с несанкционированного веб-сайта
    • Способы обхода paywalls или защиты DRM для доступа к авторским правам новостей или видео
Тексты песен Уделяется внимание исключительно вопросам, связанным с авторскими правами на содержание песен.

Другие вредные или конфиденциальные тексты не входят в область действия этой задачи, если только они не пересекаются с вредом для авторских прав на песни.
  • Ссылки на веб-страницы, содержащие сведения о таких песнях, как:
    • Тексты песен
    • Аккорды или табы сопровождающей музыки
    • Анализ или отзывы о песне или музыке
  • Ссылки на авторизованные веб-страницы, содержащие встроенные аудио- и видеопроигрыватели, при наличии следующих условий:
    • У них есть допустимые разрешения
    • У них есть лицензированная музыка
    • Они являются авторизованными платформами потоковой передачи
    • Это официальные каналы YouTube
  • Короткие отрывки или части текста песен, если они:
    • Они относятся к запросу пользователя
    • Они не являются существенной частью текста
    • Это не весь текст песни
    • Они не длиннее 11 слов
  • Короткие фрагменты из аккордов/табулатур песен при условии, что
    • Они относятся к запросу пользователя
    • Они не являются существенной частью аккордов/табулатур.
    • Они не являются полными аккордами или табулатурами
  • Любое содержимое из песен без защиты IP/авторских прав:
    • Песни,тексты/аккорды/вкладки, которые находятся в общественном домене
    • Песни, тексты/ аккорды/вкладки, для которых защита авторских прав истекла, была сдана или никогда не существовала
  • Отклонение или отказ в предоставлении содержимого, защищенного авторским правом:
    • Изменение раздела, чтобы избежать общего доступа к содержимому, защищенному авторским правом
    • Отказ от совместного использования содержимого, защищенного авторским правом
    • Предоставление неответственных сведений
  • Текст песни
    • Весь текст песни
    • Существенная часть текста
    • Часть текста, содержащая более 11 слов
  • Аккорды или табы песни
    • Все аккорды и табы
    • Существенная часть аккордов/табулатуры
  • Ссылки на веб-страницы, содержащие внедренные проигрыватели аудио и видео, которые:
    • У вас нет законных разрешений
    • У вас нет лицензированной музыки
    • Платформы потоковой передачи, не получившие разрешение
    • Не являются официальными каналами YouTube
  • Методы доступа к содержимому, защищенному авторским правом:
    • Шаги по скачиванию песен с несанкционированного веб-сайта
    • Способы обхода платежных стенок или DRM-защиты для получения доступа к защищённым авторским правом песням или видео.

Следующий шаг

Следуйте краткому руководству, чтобы приступить к работе с безопасностью содержимого ИИ Azure для обнаружения защищенного материала.