Воспроизведение звука в вызове

Действие воспроизведения, предоставленное через SDK автоматизации вызовов службы коммуникации Azure, позволяет воспроизводить звуковые подсказки для участников звонка. К этому действию можно обращаться через реализацию приложения на стороне сервера. Вы можете воспроизводить звук для вызова участников с помощью одного из двух методов;

Предоставление доступа к предварительно подготовленным звуковым файлам в формате WAV, к которым службы коммуникации Azure могут получить доступ с поддержкой проверки подлинности.
Обычный текст, который можно преобразовать в речевой вывод путем объединения с Foundry Tools.

Вы можете использовать только что объявленную интеграцию между Службами коммуникации Azure и средствами Foundry для воспроизведения персонализированных ответов с помощью службы "Текст в речь Azure". Вы можете использовать готовые к использованию предварительно созданные нейронные голоса, подобные человеческим, или создавать пользовательские нейронные голоса, уникальные для вашего продукта или бренда. Дополнительные сведения о поддерживаемых голосах, языках и языковых стандартах см. в разделе Поддержка языков и голосов в службе озвучивания.

Примечание.

Службы коммуникации Azure в настоящее время поддерживают два формата файлов: MP3-файлы с ID3V2TAG и WAV-файлы, отформатированные как 16-битовая модуляция кодов импульса (PCM) с монофоническим звуком, записанным с частотой дискретизации 16 кГц. Вы можете создавать собственные звуковые файлы с помощью средства синтеза речи и инструмента создания аудиоконтента.

Предварительно созданные нейронные тексты для голосов речи

Корпорация Майкрософт использует расширенное машинное обучение для преодоления ограничений традиционного синтеза речи в обработке стресса и интонации на разговорном языке. Прогнозирование просодии и синтез голоса происходят одновременно, что приводит к более плавному и естественному звучанию. Вы можете использовать эти нейронные голоса, чтобы сделать взаимодействие с чат-ботами и голосовыми помощниками более естественными и привлекательными. Есть более 100 предварительно созданных голосов для выбора. Дополнительные сведения о голосах для синтеза речи Azure.

Распространенные варианты использования

Действие воспроизведения можно использовать различными способами, некоторые примеры того, как разработчики могут использовать действие воспроизведения в своих приложениях, перечислены здесь.

Объявления

Ваше приложение может потребоваться воспроизвести какое-то объявление, когда участник присоединяется или покидает звонок, чтобы уведомить других пользователей.

Самообслуживание клиентов

В сценариях с системами интерактивного голосового ответа (IVR) и виртуальными помощниками можно использовать приложение или боты для воспроизведения звуковых запросов вызывающим абонентам. Этот запрос может быть в виде меню, чтобы направлять вызывающего абонента в его взаимодействии.

Удержание музыки

Действие игры также можно использовать для воспроизведения музыки для абонентов. Это действие можно настроить в цикле так, чтобы музыка продолжала играть до тех пор, пока агент не станет доступным для оказания помощи звонящему.

Воспроизведение сообщений о соответствии

В рамках требований соблюдения норм в различных отраслях, ожидается, что поставщики будут предусматривать юридические или нормативные сообщения звонившим, например, "Этот вызов записывается в целях повышения качества".

Пример архитектуры для воспроизведения звука в вызове с помощью преобразования текста в речь

Схема, показывающая пример архитектуры для взаимодействия с ИИ.

Пример архитектуры воспроизведения звука в вызове

Снимок экрана: поток для воспроизведения действия.

Известные ограничения

Подсказки для преобразования текста в речь поддерживают максимум 4 000 символов. Если ваш запрос превышает это ограничение, мы рекомендуем использовать язык разметки синтеза речи (SSML) для воспроизведения речи на основе текста.
Голоса HD из Microsoft Foundry официально не поддерживаются. Использование этих голосов приводит к истечении времени ожидания.
В сценариях, когда превышено ограничение квоты службы "Речь", можно запросить увеличение этого ограничения, выполнив описанные здесь действия.

Дальнейшие шаги

Ознакомьтесь с нашим руководством, чтобы узнать , как воспроизводить пользовательские голосовые запросы пользователям.
Узнайте об использовании и журналах операций, опубликованных автоматизацией звонков.
Узнайте о сборе входных данных клиента.

Обратная связь

Были ли сведения на этой странице полезными?

Last updated on 2026-02-25