Примечание
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Действие воспроизведения, предоставленное с помощью пакета SDK службы автоматизации вызовов Службы коммуникации Azure, позволяет воспроизводить звуковые запросы участникам звонка. К этому действию можно обращаться через реализацию приложения на стороне сервера. Вы можете воспроизводить звук для вызова участников с помощью одного из двух методов;
- Предоставление доступа к предварительно подготовленным звуковым файлам в формате WAV, к которым службы коммуникации Azure могут получить доступ с поддержкой проверки подлинности.
- Обычный текст, который можно преобразовать в выходные данные речи с помощью интеграции со службами ИИ Azure.
Вы можете использовать только что объявленную интеграцию между Службы коммуникации Azure и службами искусственного интеллекта Azure для воспроизведения персонализированных ответов с помощью azure Text-To-Speech. Вы можете использовать человеческие, такие как предварительно созданные нейронные голоса из коробки или создавать пользовательские нейронные голоса, уникальные для вашего продукта или бренда. Дополнительные сведения о поддерживаемых голосах, языках и языковых стандартах см. в разделе "Язык" и "Поддержка голосовой связи" службы "Речь".
Примечание.
Службы коммуникации Azure в настоящее время поддерживают два формата файлов: MP3-файлы с ID3V2TAG и WAV-файлы, отформатированные как 16-битовая модуляция кодов импульса (PCM) с монофоническим звуком, записанным с частотой дискретизации 16 кГц. Вы можете создать собственные звуковые файлы с помощью средства синтеза речи с помощью средства создания аудиоконтентов.
Предварительно созданные нейронные тексты для голосов речи
Корпорация Майкрософт использует расширенное машинное обучение для преодоления ограничений традиционного синтеза речи в обработке стресса и интонации на разговорном языке. Прогноз prosody и синтез голоса происходят одновременно, что приводит к более плавному и естественному выходу звука. Вы можете использовать эти нейронные голоса, чтобы сделать взаимодействие с чат-ботами и голосовыми помощниками более естественными и привлекательными. Есть более 100 предварительно созданных голосов для выбора. Дополнительные сведения о голосовых голосах в службе "Текст в речь Azure".
Распространенные варианты использования
Действие воспроизведения можно использовать различными способами, некоторые примеры того, как разработчики могут использовать действие воспроизведения в своих приложениях, перечислены здесь.
Объявления
Ваше приложение может потребоваться воспроизвести какое-то объявление, когда участник присоединяется или покидает звонок, чтобы уведомить других пользователей.
Самообслуживание клиентов
В сценариях с системами интерактивного голосового ответа (IVR) и виртуальными помощниками можно использовать приложение или боты для воспроизведения звуковых запросов вызывающим абонентам. Этот запрос может быть в виде меню, чтобы направлять вызывающего абонента в его взаимодействии.
Удержание музыки
Действие игры также можно использовать для воспроизведения музыки для абонентов. Это действие можно настроить в цикле, чтобы музыка не играла до тех пор, пока агент не будет доступен для помощи вызывающей.
Воспроизведение сообщений о соответствии
В рамках требований соблюдения норм в различных отраслях, ожидается, что поставщики будут предусматривать юридические или нормативные сообщения звонившим, например, "Этот вызов записывается в целях повышения качества".
Пример архитектуры для воспроизведения звука в вызове с помощью преобразования текста в речь
Пример архитектуры воспроизведения звука в вызове
Известные ограничения
- Подсказки для преобразования текста в речь поддерживают максимум 4 000 символов. Если ваш запрос превышает это ограничение, мы рекомендуем использовать язык разметки синтеза речи (SSML) для воспроизведения речи на основе текста.
- Голоса HD из Azure AI Foundry официально не поддерживаются. Использование этих голосов приводит к истечении времени ожидания.
- В сценариях, когда превышено ограничение квоты службы "Речь", можно запросить увеличение этого ограничения, выполнив описанные здесь действия.
Дальнейшие шаги
- Ознакомьтесь с нашим руководством, чтобы узнать , как воспроизводить пользовательские голосовые запросы пользователям.
- Узнайте об использовании и операционных журналах, опубликованных автоматизацией вызовов .
- Узнайте о сборе входных данных клиента.