Что такое Azure Speech в интерфейсе командной строки инструментария Foundry?

Speech CLI — это средство командной строки для использования Azure Speech в инструментах Foundry без написания кода. Для интерфейса командной строки службы "Речь" требуется минимальная настройка, и вы можете сразу начать экспериментировать с ключевыми функциями службы "Речь". В течение нескольких минут выполните простые тестовые рабочие процессы, такие как пакетное распознавание речи из каталога файлов или преобразование текста в речь для набора строк из файла. Помимо простых рабочих процессов, интерфейс командной строки Speech CLI готов к использованию в производственной среде. Масштабируйте его для выполнения более крупных процессов, используя автоматизированные .bat или скрипты оболочки.

Большинство функций в пакете SDK для службы "Речь" доступны в интерфейсе командной строки службы "Речь", а некоторые расширенные функции и настройки упрощаются. При выборе между интерфейсом командной строки службы "Речь" и пакетом SDK службы "Речь" следует учитывать следующие рекомендации.

Используйте Speech CLI, когда:

  • Вы хотите поэкспериментировать с функциями службы "Речь" с минимальными настройками и без написания кода.
  • У вас есть относительно простые требования к рабочему приложению, использующего службу "Речь".

Используйте пакет SDK для речевых технологий, если:

  • Вы хотите интегрировать функциональные возможности службы "Речь" на определенном языке или платформе (например, C#, Python или C++).
  • У вас есть сложные требования, которые могут потребовать дополнительных запросов на обслуживание.
  • Вы разрабатываете пользовательское поведение, включая потоковую передачу ответов.

Основные возможности

  • Распознавание речи: преобразование речи в текст из звуковых файлов или непосредственно с микрофона или транскрибирование записанной беседы.

  • Речевой синтез: преобразование текста в речь из текстовых файлов или непосредственно из командной строки. Настройте характеристики выходных данных речи с помощью конфигураций языка разметки синтеза речи (SSML).

  • Перевод речи: Перевод звуковой дорожки на исходном языке в текст или аудио на целевом языке.

  • Вычислительный ресурс Azure: Отправляйте команды CLI для речи для выполнения на удаленном вычислительном ресурсе Azure с помощью spx webjob.

Начать

Чтобы начать работу с интерфейсом командной строки службы распознавания речи, ознакомьтесь с руководством по быстрому началу работы. В статье описывается, как выполнять основные команды и несколько более сложные команды для выполнения пакетных операций по преобразованию речи в текст и текста в речь. После чтения основных статей достаточно понимания синтаксиса для написания пользовательских команд или автоматизации простых операций службы "Речь".

Следующие шаги