Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Внимание
Элементы, обозначенные в этой статье как (предварительная версия), сейчас предлагаются в общедоступной предварительной версии. Эта предварительная версия предоставляется без соглашения об уровне обслуживания, и мы не рекомендуем ее для рабочих нагрузок. Некоторые функции могут не поддерживаться или их возможности могут быть ограничены. Дополнительные сведения см. в статье Дополнительные условия использования Предварительных версий Microsoft Azure.
Оценка произношения использует технологию преобразования речи в текст для предоставления субъективной и объективной обратной связи для изучающих язык. Практика произношения и своевременное получение отзывов очень важны для улучшения языковых навыков. Оценки, проведенные опытными учителями, могут занять много времени и могут быть дорогостоящими для учащихся. Оценка произношения может помочь сделать процесс более привлекательным и доступным для учащихся с любым опытом.
В этой статье описывается, как использовать средство оценки произношения без написания кода на портале Microsoft Foundry. Сведения об интеграции оценки произношения в речевые приложения см. в статье Использование технологии оценки произношения.
Примечание.
Сведения о доступности оценки произношения см. на страницах со списками поддерживаемых языков и доступных регионов.
Чтение, речь и игровые сценарии
Для оценки произношения существует три сценария: чтение, речь и игры.
- Чтение: Этот сценарий предназначен для сценарного тестирования. Он требует, чтобы учащийся читал заданный текст. Справочный текст предоставляется заранее.
- Говоря: этот сценарий предназначен для неписаной оценки. Он требует, чтобы учащийся говорил по заданной теме. Справочный текст заранее не предоставляется.
- Игровой процесс: этот сценарий предназначен для сценарного тестирования. Он требует, чтобы учащиеся читали твистер, чтобы получать оценки для произношения и для каждого слога. Справочный текст предоставляется заранее.
Проведение оценки чтения
Выполните следующие действия, чтобы оценить свое произношение эталонного текста.
Перейдите к оценке произношения на портале Microsoft Foundry.
На вкладке "Чтение" выберите поддерживаемый язык , который вы хотите оценить произношение.
Вы можете использовать подготовленные текстовые примеры или ввести собственный скрипт.
При чтении текста необходимо быть рядом с микрофоном, чтобы записанный голос не был слишком низким.
В противном случае можно отправить аудиозапись для оценки произношения. После успешной отправки звук будет автоматически оцениваться системой, как показано на следующем снимке экрана.
Проведение говорной оценки
Если вы хотите провести нескрипированную оценку, перейдите на вкладку "Речь". Эта функция позволяет проводить неписаную оценку, не предоставляя справочный текст заранее. Вот как это сделать:
Перейдите к оценке произношения на портале Microsoft Foundry.
На вкладке "Речь" выберите поддерживаемый язык , который вы хотите оценить произношение.
Затем можно выбрать из примера тем, предоставленных или ввести собственный раздел. Этот выбор позволяет оценить возможность говорить по заданной теме без предопределенного сценария.
При записи речи для оценки произношения важно убедиться, что время записи попадает в рекомендуемый диапазон от 15 секунд (эквивалентно более 50 слов) до 10 минут. Этот диапазон времени является оптимальным для оценки содержимого речи точно. Чтобы получить оценку темы, ваша речь должна содержать по крайней мере три предложения.
Вы также можете отправить записанный звук для оценки произношения. После успешной отправки звук будет автоматически оцениваться системой.
Проведение оценки игр
Если вы хотите обучать язык с помощью игры, выполните следующие действия:
Перейдите к оценке произношения на портале Microsoft Foundry.
На вкладке "Игры" выберите поддерживаемый язык для оценки произношения и создайте новую скороговорку, которую хотите практиковать.
Наконец, вы можете начать записывать и практиковать скороговорку, чтобы получить оценки.
Результаты оценки произношения
После записи речи или отправки записанного звука результат оценки выводится. Результат включает в себя вашу речь и обратную связь по оценке вашей речи. Вы можете прослушать свою речь и скачать её при необходимости.
Вы также можете проверить результат оценки произношения в формате JSON. Оценки точности на уровне слов, слогов и фонем включены в файл JSON.
Слово выделено в соответствии с типом ошибки. Типы ошибок в оценке произношения представлены с помощью различных цветов. Это визуальное различие упрощает выявление и анализ конкретных ошибок. Он предоставляет четкий обзор типов ошибок и частот в голосовом звуке, помогая сосредоточиться на областях, которые нуждаются в улучшении. Вы можете включить или отключить каждый тип ошибки, чтобы сосредоточиться на определенных типах ошибок или исключить определенные типы из дисплея. Эта функция обеспечивает гибкость в том, как вы просматриваете и анализируете ошибки в голосовом звуке. При наведении указателя мыши на каждое слово можно увидеть оценки точности для всего слова или отдельных фонем.
В нижней части результата оценки отображаются результаты оценки. Для оценки произношения по заданному тексту предоставляется только оценка произношения (включая оценку точности, беглости, полноты и просодии). Для неписаной оценки произношения отображаются оценка произношения (включая оценку точности, оценку беглости и оценку просодии) и оценку содержимого (включая оценку словаря, оценку грамматики и оценку темы).
Степень детализации оценки произношения
Оценка произношения предоставляет различные результаты оценки с разной степенью детализации, от отдельных фонем до всего введенного текста.
- На полнотекстовом уровне оценка произношения предлагает дополнительные оценки беглости, полноты и просодии: беглость указывает, насколько речь соответствует использованию пауз между словами, характерных для носителей языка; полнота указывает, сколько слов правильно произносится в речи по сравнению с эталонным текстом; просодия указывает, насколько хорошо говорящий передает элементы естественности, выразительности и общей просодии в своей речи. Затем дается общая оценка, агрегированная из Точности, Беглости, Завершенности и Просодии, чтобы указать общее качество произношения данной речи. Оценка произношения также предлагает оценку содержимого (словарь, грамматика и раздел) на полном текстовом уровне.
- На уровне слова оценка произношения может автоматически обнаруживать ошибки и одновременно предоставлять оценку точности, которая дает более подробную информацию об упущениях, повторениях, вставках и неправильном произношении в данной речи.
- Оценки точности на уровне слога в настоящее время доступны через JSON-файл или Speech SDK.
- На уровне фонем оценка произношения предоставляет оценки точности каждой фонемы, помогая учащимся лучше разобраться в деталях произношения своей речи.
Помимо базовых показателей точности, беглости и полноты, функция оценки произношения в Microsoft Foundry включает более комплексные оценки, чтобы предоставить подробные отзывы о различных аспектах производительности речи и понимания. Улучшенные оценки таковы: оценка просодии, словарная оценка, оценка грамматики и оценка темы. Эти оценки предоставляют ценные сведения о речевой просодии, использовании словаря, правильности грамматики и понимании тем.
В нижней части результата оценки отображаются две общие оценки: оценка произношения и оценка содержимого. На вкладке "Чтение" отображается оценка произношения. На вкладке "Речь" отображаются оценка произношения и оценка содержимого.
Оценка произношения: эта оценка представляет агрегированную оценку качества произношения и включает четыре подспекта. Эти оценки доступны как на вкладках чтения, так и на вкладках говорения как для сценарных, так и не сценарных оценок.
- Оценка точности: оценивает правильность произношения.
- Оценка беглости: измеряет уровень гладкости и естественности речи.
- Оценка полноты: отражает количество слов, произнесемых правильно.
- Оценка просодии: оценивает использование соответствующих интонаций, ритмов и стрессов. Вводятся несколько других типов ошибок, связанных с оценкой просодии, например Непредвиденный перерыв, Отсутствие перерыва и Монотонность. Эти типы ошибок предоставляют более подробные сведения об ошибках произношения по сравнению с предыдущим механизмом.
Оценка содержимого: эта оценка обеспечивает агрегированную оценку содержимого речи и включает три подспекта. Эта оценка доступна только на вкладке "Речь" для неписаной оценки.
- Оценка словаря: оценивает эффективное использование слов говорящего и их правильность в данном контексте для точного выражения идей и уровня лексической сложности.
- Оценка грамматики: оценивает правильность использования грамматики и различные шаблоны предложений. Он рассматривает лексическую точность, грамматическую точность и разнообразие структур предложений, обеспечивая более полную оценку знаний языка.
- Оценка темы: оценивает уровень понимания и взаимодействия с темой, рассмотренной в речи. Он оценивает способность докладчика эффективно выражать мысли и идеи, связанные с данной темой.
Эти общие оценки предлагают комплексную оценку произношения и содержимого, предоставляя учащимся ценные отзывы о различных аспектах их производительности речи и понимания. Благодаря этим расширенным функциям учащиеся языка могут получить более подробную информацию о своих преимуществах и областях для улучшения произношения и выражения контента.
Примечание.
Оценка содержимого и просодии доступна только в локали en-US.
Оценочные баллы в режиме потоковой передачи
Оценка произношения поддерживает непрерывный режим потоковой передачи. Демонстрация Microsoft Foundry позволяет выполнять до 60 минут записи в режиме потоковой передачи для оценки. Если вы не нажимаете кнопку остановки записи, процесс оценки не завершается, и вы можете приостановить и возобновить оценку удобно.
Оценка произношения оценивает несколько аспектов произношения. Внизу результата оценки вы увидите оценку произношения как общую сводную оценку, которая включает в себя 4 подаспекта: оценку точности, оценку беглости, оценку полноты и оценку прозодии. В режиме потоковой передачи, поскольку оценка точности, оценка беглости и оценка просодии будут варьироваться во время процесса записи, мы показали подход в Microsoft Foundry, чтобы отображать приблизительную общую оценку по мере ее изменения до окончания оценки, которая взвешивается только на основе оценок точности, беглости и просодии. Оценка полноты вычисляется только в конце оценки после нажатия кнопки остановки, поэтому окончательная общая оценка произношения агрегируется из оценки точности, оценки беглости, оценки полноты и оценки просодии с учетом коэффициента.
Ознакомьтесь с примерами демонстрации, приведенными ниже, для всего процесса оценки произношения в режиме потоковой передачи.
Начать запись
При начале записи оценки в нижней части начинают изменяться с 0.
Во время записи
Во время записи длинного абзаца можно приостановить запись в любое время. Вы можете продолжать оценивать запись, пока вы не нажимаете кнопку остановки.
Завершение записи
После нажатия кнопки остановки вы увидите оценку произношения, оценку точности, оценку плавности, оценку полноты и оценку просодии в нижней части.
Цены
В качестве базового уровня использование оценки произношения стоит столько же, сколько преобразование речи в текст для стандартного тарифа или тарифа за обязательство. Если вы приобретаете уровень обязательства для преобразования речи в текст, расходы на оценку произношения засчитываются в счет выполнения обязательств.
Функция анализа произношения также предлагает другие оценки, которые не включены в базовую цену за преобразование речи в текст, например, просодическая оценка. Эти показатели доступны за дополнительную плату сверх базовой цены за преобразование речи в текст. Сведения о ценах см. цены на преобразование речи в текст.
Ниже приведена таблица доступных показателей оценки произношения, доступных в скриптах или неподготовленных проверках, а также о том, включена ли она в стоимость преобразования речи в текст или стоимость дополнительной функции.
| Балл | Скрипты или импровизированные | Включено в базовую цену распознавания речи? |
|---|---|---|
| Правильность | Сценарные и несценарные | Да |
| Беглость | Сценарные и несценарные | Да |
| Полнота | Сценарный | Да |
| Ошибка | Сценарные и несценарные | Да |
| Просодия | Сценарные и несценарные | нет |
Ответственное применение ИИ
Система ИИ включает не только технологию, но и людей, которые используют ее, людей, которые будут затронуты ею, и среды, в которой она развернута. Ознакомьтесь с заметками о прозрачности, чтобы узнать об использовании и развертывании ответственного искусственного интеллекта в системах.
Следующие шаги
- Используйте оценку произношения с помощью Speech SDK
- Ознакомьтесь с блогом о вариантах использования