Поделиться через


Обнаружение и удаление персонально идентифицирующей информации в беседах

Язык Azure в инструменте Foundry Tools, связанном с API анализа PII, анализирует аудиообсуждение для выявления и редактирования конфиденциальной информации (PII), используя различные предопределенные категории. Этот API работает как на транскрибированном тексте (называемом расшифровками), так и на чатах. Для расшифровок процесс редактирования сегментов аудио, содержащих личную информацию, упрощается путем предоставления сведений о времени этих сегментов.

Определение способа обработки данных (необязательно)

Указание модели обнаружения персональных данных

По умолчанию эта функция использует последнюю доступную модель ИИ для входных данных. Вы также можете настроить запросы API для использования определенной версии модели.

Поддержка языков

Для получения дополнительной информации см.страницу поддержки языка PII. В настоящее время модель разговорного ИИ для обработки персональных данных поддерживает только английский язык. Модель предварительной версии и API поддерживают те же языки списков , что и другие языки.

Поддержка регионов

API общения PII поддерживает все регионы Azure, поддерживаемые языком Azure.

Отправка данных

Входные данные можно отправить в API в виде списка элементов беседы. Анализ выполняется при получении запроса. Так как API является асинхронным, может возникнуть задержка между отправкой запроса API и получением результатов. Сведения о размере и количестве запросов, которые можно отправлять в минуту и секунду, см. в следующих ограничениях данных.

При использовании асинхронной функции результаты API доступны в течение 24 часов с момента приема запроса и указываются в ответе. По истечении этого периода результаты очищаются и больше не будут доступны для извлечения.

При отправке данных в личные данные беседы можно отправлять по одному разговору (чату или разговору) на запрос.

API пытается обнаружить все определенные категории сущностей для заданных входных данных беседы. Если вы хотите указать, какие сущности обнаружены и возвращаются, используйте необязательный piiCategories параметр с соответствующими категориями сущностей.

Для речевых расшифровок обнаруженные сущности возвращаются по указанному redactionSource значению параметра. В настоящее время поддерживаемые значения redactionSource: text, lexical, itn и maskedItn (которые сопоставляются с REST API Речь в текст форматов display, \, displayText, lexical, itn и maskedItn соответственно). Кроме того, для ввода голосовых данных этот API также предоставляет информацию о временных метках аудио, что позволяет редактировать аудиоматериалы. Для использования функции audioRedaction используйте необязательный includeAudioRedaction флаг со true значением. Редактирование аудио выполняется с использованием лексического формата ввода.

Примечание.

PiI беседы теперь поддерживает 40 000 символов в виде размера документа.

Получение обнаруженных персональных данных

При получении результатов от функции распознавания персональных данных можно передать результаты в приложение в потоке или сохранить выходные данные в файл в локальной системе. Ответ API включает распознанные сущности, включая их категории и подкатегории, а также оценки достоверности. Строка текста с сущностями PII, редактированная, также возвращается.

Примеры

  1. Перейдите на страницу обзора ресурса на портале Azure

  2. В меню слева выберите Ключи и конечная точка. Для проверки подлинности запросов API вам потребуется один из ключей и конечной точки.

  3. Скачайте и установите пакет клиентской библиотеки для выбранного языка:

    Язык Версия пакета
    .NET 1.0.0
    Питон 1.0.0
  4. Дополнительные сведения о клиенте и возвращаемом объекте см . в следующей справочной документации:

Ограничения службы и данных

Сведения о размере и числе запросов, которые можно отправлять в минуту и секунду, см. в статье об ограничениях службы.