Поделиться через


Воспроизведение звука в вызове

Действие воспроизведения, предоставленное с помощью пакета SDK службы автоматизации вызовов Службы коммуникации Azure, позволяет воспроизводить звуковые запросы участникам звонка. К этому действию можно обращаться через реализацию приложения на стороне сервера. Вы можете воспроизводить звук для вызова участников с помощью одного из двух методов;

  • Предоставление доступа к предварительно подготовленным звуковым файлам в формате WAV, к которым службы коммуникации Azure могут получить доступ с поддержкой проверки подлинности.
  • Обычный текст, который можно преобразовать в выходные данные речи с помощью интеграции со службами ИИ Azure.

Вы можете использовать только что объявленную интеграцию между Службы коммуникации Azure и службами искусственного интеллекта Azure для воспроизведения персонализированных ответов с помощью azure Text-To-Speech. Вы можете использовать человеческие, такие как предварительно созданные нейронные голоса из коробки или создавать пользовательские нейронные голоса, уникальные для вашего продукта или бренда. Дополнительные сведения о поддерживаемых голосах, языках и языковых стандартах см. в разделе "Язык" и "Поддержка голосовой связи" службы "Речь".

Примечание.

Службы коммуникации Azure в настоящее время поддерживают два формата файлов: MP3-файлы с ID3V2TAG и WAV-файлы, отформатированные как 16-битовая модуляция кодов импульса (PCM) с монофоническим звуком, записанным с частотой дискретизации 16 кГц. Вы можете создать собственные звуковые файлы с помощью средства синтеза речи с помощью средства создания аудиоконтентов.

Предварительно созданные нейронные тексты для голосов речи

Корпорация Майкрософт использует расширенное машинное обучение для преодоления ограничений традиционного синтеза речи в обработке стресса и интонации на разговорном языке. Прогноз prosody и синтез голоса происходят одновременно, что приводит к более плавному и естественному выходу звука. Вы можете использовать эти нейронные голоса, чтобы сделать взаимодействие с чат-ботами и голосовыми помощниками более естественными и привлекательными. Есть более 100 предварительно созданных голосов для выбора. Дополнительные сведения о голосовых голосах в службе "Текст в речь Azure".

Распространенные варианты использования

Действие воспроизведения можно использовать различными способами, некоторые примеры того, как разработчики могут использовать действие воспроизведения в своих приложениях, перечислены здесь.

Объявления

Ваше приложение может потребоваться воспроизвести какое-то объявление, когда участник присоединяется или покидает звонок, чтобы уведомить других пользователей.

Самообслуживание клиентов

В сценариях с системами интерактивного голосового ответа (IVR) и виртуальными помощниками можно использовать приложение или боты для воспроизведения звуковых запросов вызывающим абонентам. Этот запрос может быть в виде меню, чтобы направлять вызывающего абонента в его взаимодействии.

Удержание музыки

Действие игры также можно использовать для воспроизведения музыки для абонентов. Это действие можно настроить в цикле, чтобы музыка не играла до тех пор, пока агент не будет доступен для помощи вызывающей.

Воспроизведение сообщений о соответствии

В рамках требований соблюдения норм в различных отраслях, ожидается, что поставщики будут предусматривать юридические или нормативные сообщения звонившим, например, "Этот вызов записывается в целях повышения качества".

Пример архитектуры для воспроизведения звука в вызове с помощью преобразования текста в речь

Схема, показывающая пример архитектуры для воспроизведения с помощью ИИ.

Пример архитектуры воспроизведения звука в вызове

Снимок экрана: поток для воспроизведения действия.

Известные ограничения

  • Подсказки для преобразования текста в речь поддерживают максимум 4 000 символов. Если ваш запрос превышает это ограничение, мы рекомендуем использовать язык разметки синтеза речи (SSML) для воспроизведения речи на основе текста.
  • Голоса HD из Azure AI Foundry официально не поддерживаются. Использование этих голосов приводит к истечении времени ожидания.
  • В сценариях, когда превышено ограничение квоты службы "Речь", можно запросить увеличение этого ограничения, выполнив описанные здесь действия.

Дальнейшие шаги