Документация по преобразованиям речи в текст
Преобразование речи в текст с помощью службы Azure Speech, также известное как распознавание речи, позволяет выполнять как в режиме реального времени, так и в пакетной транскрипции аудиопотоков в текст. С помощью ввода дополнительных справочных текстовых данных он также обеспечивает оценку произношения в режиме реального времени и дает отзыв о точности и плавности звука речи.
Разработка с использованием распознавания речи в текст
Практическое руководство
- Использование API быстрого транскрибирования
- Создание пользовательского проекта речи
- Обучение модели для настройки речи
- Использование форматов сжатых входных звуковых данных