Обзор центра вызовов

Языковые и речевые инструменты Azure в Foundry Tools помогут вам реализовать частичную или полную автоматизацию взаимодействий с клиентами на основе телефонии и обеспечить доступность через несколько каналов. С помощью служб языка и речи Azure можно дополнительно анализировать транскрибирование центра вызовов, извлекать и редактировать личную информацию, суммировать транскрибирование и обнаруживать тональность.

Ниже приведены примеры сценариев реализации средств Foundry в центрах звонков и контактов:

  • Виртуальные агенты: голосовые боты и чат-боты с голосовой поддержкой, интегрированные с телефонными системами на основе разговорного ИИ.
  • Поддержка агентов. Транскрибирование и анализ звонка в режиме реального времени для улучшения взаимодействия с клиентами путем предоставления аналитических сведений и предложения действий агентам.
  • Аналитика после вызова: анализ после вызова для создания аналитических сведений о беседах клиентов для улучшения понимания и поддержки непрерывного улучшения обработки вызовов, оптимизации контроля качества и соответствия требованиям, а также других аналитических оптимизаций.

Совет

Попробуйте Language Studio или Speech Studio для демонстрации использования служб языка и речи Azure для анализа бесед в центре вызовов.

Чтобы развернуть решение транскрибирования центра вызовов для Azure с использованием подхода без кода, попробуйте использовать клиент Ingestion.

Функции средств Foundry для центров вызовов

Целостная реализация центра обработки вызовов обычно включает технологии из служб языка и речи Azure.

Звуковые данные, обычно используемые в контакт-центрах и полученные через стационарные телефоны, мобильные телефоны и радио, часто имеют узкополосную полосу в пределах 8 кГц, что может создавать проблемы при преобразовании речи в текст. Модели распознавания службы "Речь" обучаются для обеспечения высококачественного транскрибирования независимо от способа записи аудио.

После транскрибирования звука с помощью службы "Речь" вы можете использовать службу языка Azure для анализа данных центра обработки вызовов, таких как анализ тональности, сводка причины вызовов клиентов, их разрешение, извлечение и изменение личных данных беседы и многое другое.

Служба речи

Языковая служба предлагает следующие возможности, которые можно применять для вариантов использования в центре обработки вызовов:

  • Речь в режиме реального времени: распознавание и транскрибирование звука в режиме реального времени из нескольких входных данных. Например, с помощью виртуальных агентов или поддержки агентов можно непрерывно распознавать входные аудиоданные и управлять обработкой результатов на основе нескольких событий.
  • Пакетное преобразование речи в текст: транскрибирование больших объемов аудиофайлов асинхронно, включая выделение голосов, и обычно используется в сценариях анализа звонков после их завершения. Диаризация — это процесс распознавания и разделения говорящих в моноканальных аудиоданных.
  • Text to speech: Text to speech позволяет приложениям, средствам или устройствам преобразовать текст в синтезированную речь человека.
  • Идентификация говорящего: помогает определить личность неизвестного говорящего в группе зарегистрированных говорящих; обычно используется для сценариев проверки клиентов центра обработки вызовов или выявления мошенничества.
  • Определение языка. Определение языков аудио. Функцию можно использовать при анализе в режиме реального времени и после вызова для получения аналитических сведений или управления средой (например, сведения о языке выходных данных виртуального агента).

Вам может быть желательно дополнительно адаптировать и настроить опыт использования для вашего продукта или среды. Типичные примеры для тонкой настройки речи

Настройка распознавания речи Описание
Настраиваемая речь Функция преобразования речи в текст, используемая для оценки и улучшения точности распознавания речи для специфичных сценариев использования (например, буквенно-числовых идентификаторов клиентов, дел, и контрактов, номерных знаков и имен). Кроме того, вы можете обучить пользовательскую модель с использованием собственных названий продуктов и отраслевой терминологии.
Пользовательский голос Функция text to speech, которая позволяет создавать однообразный, настраиваемый искусственный голос для ваших приложений.

Языковая служба

Языковая служба предлагает следующие возможности, которые можно использовать для вариантов использования в центре обработки вызовов:

  • Извлечение и редактирование личных сведений: идентифицируйте, классифицируйте и редактируйте конфиденциальную информацию при транскрибировании бесед.
  • Суммирование беседы: Составьте абстрактный текст о том, что каждый участник беседы сказал о проблемах и их решениях. Например, центр обработки вызовов может группировать сведения о самых значительных проблемах с продуктами.
  • Анализ тональности и анализ мнений: анализируйте расшифровки и определяйте положительную, нейтральную или негативную тональность на уровне высказывания и беседы.

Вам может потребоваться дополнительно настроить и провести тонкую настройку моделей для получения более детальной информации из данных. Типичные примеры настройки языка:

Настройка языка Описание
Настраиваемое NER (распознавание именованных сущностей) Улучшение обнаружения и извлечения сущностей в расшифровках.
Настраиваемая классификация текста Классифицируйте и маркируйте транскрибированные речевые фрагменты с помощью одной или нескольких классификаций.

Общие сведения обо всех функциях языковой службы и возможностях настройки можно найти здесь.

Следующие шаги