Воспроизведение звука в вызове

Действие воспроизведения, предоставленное через SDK автоматизации вызовов службы коммуникации Azure, позволяет воспроизводить звуковые подсказки для участников звонка. К этому действию можно обращаться через реализацию приложения на стороне сервера. Вы можете воспроизводить звук для вызова участников с помощью одного из двух методов;

  • Предоставление доступа к предварительно подготовленным звуковым файлам в формате WAV, к которым службы коммуникации Azure могут получить доступ с поддержкой проверки подлинности.
  • Обычный текст, который можно преобразовать в речевой вывод путем объединения с Foundry Tools.

Вы можете использовать только что объявленную интеграцию между Службами коммуникации Azure и средствами Foundry для воспроизведения персонализированных ответов с помощью службы "Текст в речь Azure". Вы можете использовать готовые к использованию предварительно созданные нейронные голоса, подобные человеческим, или создавать пользовательские нейронные голоса, уникальные для вашего продукта или бренда. Дополнительные сведения о поддерживаемых голосах, языках и языковых стандартах см. в разделе Поддержка языков и голосов в службе озвучивания.

Примечание.

Службы коммуникации Azure в настоящее время поддерживают два формата файлов: MP3-файлы с ID3V2TAG и WAV-файлы, отформатированные как 16-битовая модуляция кодов импульса (PCM) с монофоническим звуком, записанным с частотой дискретизации 16 кГц. Вы можете создавать собственные звуковые файлы с помощью средства синтеза речи и инструмента создания аудиоконтента.

Предварительно созданные нейронные тексты для голосов речи

Корпорация Майкрософт использует расширенное машинное обучение для преодоления ограничений традиционного синтеза речи в обработке стресса и интонации на разговорном языке. Прогнозирование просодии и синтез голоса происходят одновременно, что приводит к более плавному и естественному звучанию. Вы можете использовать эти нейронные голоса, чтобы сделать взаимодействие с чат-ботами и голосовыми помощниками более естественными и привлекательными. Есть более 100 предварительно созданных голосов для выбора. Дополнительные сведения о голосах для синтеза речи Azure.

Распространенные варианты использования

Действие воспроизведения можно использовать различными способами, некоторые примеры того, как разработчики могут использовать действие воспроизведения в своих приложениях, перечислены здесь.

Объявления

Ваше приложение может потребоваться воспроизвести какое-то объявление, когда участник присоединяется или покидает звонок, чтобы уведомить других пользователей.

Самообслуживание клиентов

В сценариях с системами интерактивного голосового ответа (IVR) и виртуальными помощниками можно использовать приложение или боты для воспроизведения звуковых запросов вызывающим абонентам. Этот запрос может быть в виде меню, чтобы направлять вызывающего абонента в его взаимодействии.

Удержание музыки

Действие игры также можно использовать для воспроизведения музыки для абонентов. Это действие можно настроить в цикле так, чтобы музыка продолжала играть до тех пор, пока агент не станет доступным для оказания помощи звонящему.

Воспроизведение сообщений о соответствии

В рамках требований соблюдения норм в различных отраслях, ожидается, что поставщики будут предусматривать юридические или нормативные сообщения звонившим, например, "Этот вызов записывается в целях повышения качества".

Пример архитектуры для воспроизведения звука в вызове с помощью преобразования текста в речь

Схема, показывающая пример архитектуры для взаимодействия с ИИ.

Пример архитектуры воспроизведения звука в вызове

Снимок экрана: поток для воспроизведения действия.

Известные ограничения

  • Подсказки для преобразования текста в речь поддерживают максимум 4 000 символов. Если ваш запрос превышает это ограничение, мы рекомендуем использовать язык разметки синтеза речи (SSML) для воспроизведения речи на основе текста.
  • Голоса HD из Microsoft Foundry официально не поддерживаются. Использование этих голосов приводит к истечении времени ожидания.
  • В сценариях, когда превышено ограничение квоты службы "Речь", можно запросить увеличение этого ограничения, выполнив описанные здесь действия.

Дальнейшие шаги