Поделиться через


Сбор входных данных пользователей

Благодаря выпуску действия распознавания Службы коммуникации Azure службы автоматизации вызовов разработчики теперь могут улучшить свои приложения IVR или контактного центра для распознавания входных данных пользователей. Одним из наиболее распространенных сценариев распознавания является воспроизведение сообщения для пользователя, которое предлагает им предоставить ответ, который затем распознается приложением, после того как он распознает приложение, а затем выполняет соответствующее действие. Входные данные от вызывающих устройств можно получить несколькими способами, включая DTMF (входные данные пользователя с помощью цифр на вызывающем устройстве), речь или сочетание как DTMF, так и речи.

Распознавание речи с текстом

Интеграция служб коммуникации Azure со службами ИИ Azure позволяет выполнять анализ звука в режиме реального времени для транскрибирования слова в текст. Корпорация Майкрософт использует универсальную языковую модель в качестве базовой модели, которая обучена данными, принадлежащими Майкрософт, и отражает часто используемый язык. Эта модель предварительно обучена диалектами и фонетиками, представляющими различные общие домены. Дополнительные сведения о поддерживаемых языках см. в разделе "Языки" и "Поддержка голосовой связи" службы "Речь".

DTMF

Распознавание многочастотного (DTMF) — это процесс понимания тонов и звуков, создаваемых телефоном при нажатии номера. Оборудование на принимающем конце прослушивает конкретный тон, а затем преобразует их в команды. Эти команды обычно сигнализируют о намерении пользователя при переходе к меню в сценарии IVR или в некоторых случаях можно использовать для записи важных сведений, которые пользователь должен предоставить через клавиатуру телефонов.

События DTMF и связанные с ними тоны

Мероприятие Тон
0 Ноль
1 Единица
2 Два
3 Три
4 Четыре
5 Пять
6 Шесть
7 Семь
8 Восемь
9 Девять
а A
B Б
C C
D D
* Звездочка
# Фунт

Распространенные варианты использования

Действие распознавания можно использовать по многим причинам, вот несколько примеров того, как разработчики могут использовать действие распознавания в своем приложении.

Улучшение взаимодействия пользователей с помощью запросов самообслуживания

  • Пользователи могут управлять вызовом . Включив распознавание входных данных, вы позволяете вызывающему пользователю перемещаться по меню IVR и предоставлять сведения, которые можно использовать для разрешения запроса.
  • Сбор сведений о пользователе. Включение распознавания входных данных , которое приложение может собирать входные данные от вызывающих лиц. Это могут быть такие сведения, как номера счетов, сведения о кредитной карте и т. д.
  • Transcribe caller response — с помощью распознавания голоса вы можете собирать входные данные пользователя и транскрибировать звук в текст и анализировать его для выполнения конкретных бизнес-действий.

Прерывание звуковых запросов

Пользователь может выйти из меню IVR и поговорить с агентом человека. С прерыванием DTMF приложение может позволить пользователям прерывать поток меню IVR и иметь возможность общения с агентом человека.

Пример архитектуры для сбора входных данных пользователей в вызове с помощью распознавания голоса

Схема, показывающая пример архитектуры для распознавания действий ИИ.

Пример архитектуры для сбора входных данных пользователей в вызове

Распознать действие

Известные ограничения

  • Вместо этого используйте RFC 2833 DTMF в полосе DTMF.
  • Текстовые запросы на речь поддерживают не более 400 символов, если ваш запрос больше, чем это мы рекомендуем использовать SSML для действий воспроизведения на основе текста в речь.
  • В сценариях, когда превышено ограничение квоты службы "Речь", можно запросить увеличение этого ограничения, выполнив описанные здесь действия.

Следующие шаги