Обзор языка разметки синтеза речи (SSML)

Язык разметки синтеза речи (SSML) — это язык разметки на основе XML, который можно использовать для точной настройки текста на выходные атрибуты речи, такие как шаг, произношение, скорость речи, громкость и многое другое. Он обеспечивает больший контроль и гибкость, чем входные данные обычного текста.

Совет

Вы можете слышать голоса в разных стилях и полях чтения примера текста с помощью коллекции голосов.

Варианты использования

SSML предназначен для обеспечения гибкости в том, как вы хотите, чтобы выходные данные речи звучали, и они предоставляют различные свойства для настройки выходных данных. SSML можно использовать для:

Определите входную структуру текста, которая определяет структуру , содержимое и другие характеристики текста для вывода речи. Например, можно использовать SSML для определения абзаца, предложения, перерыва или паузы или молчания. Текст можно упаковать с помощью тегов событий, таких как закладка или viseme, что приложение может обрабатывать позже. Viseme — это визуальное описание фонема, отдельных звуков речи, на разговорном языке.
Выберите голос, язык, имя, стиль и роль. Вы можете использовать несколько голосов в одном документе SSML. Вы также можете настроить акцент, скорость речи, шаг и громкость. SSML также может вставлять предварительно подготовленный звук, например звуковой эффект или музыкальную заметку.
Управление произношением выходного звука. Например, можно использовать SSML с фонемами и пользовательским лексиконом для улучшения произношения. Вы также можете использовать SSML для определения того, как произносится слово или математическое выражение.

Способы работы с SSML

Функции SSML доступны в различных инструментах, которые могут соответствовать вашему варианту использования.

Внимание

Плата за каждый символ, преобразованный в речь, включая знаки препинания. Хотя сам документ SSML не оплачивается, служба подсчитывает необязательные элементы, которые используются для настройки преобразования текста в речь, таких как фонемы и поле, как оплачиваемые символы. Дополнительные сведения см. в заметке о ценах.

SSML можно использовать следующим образом:

Средство создания звукового содержимого позволяет создавать обычный текст и SSML в Speech Studio. Вы можете прослушивать выходной звук и настраивать SSML для улучшения синтеза речи. Дополнительные сведения см. в разделе "Синтез речи" с помощью средства создания аудиоконтентов.
API пакетного синтеза принимает SSML через inputs свойство.
Интерфейс командной строки "Речь" принимает SSML через аргумент командной spx synthesize --ssml SSML строки.
Пакет SDK службы "Речь" принимает SSML через метод SSML "говорить" на разных поддерживаемых языках.

Следующие шаги

Обратная связь

Были ли сведения на этой странице полезными?

Last updated on 2026-02-25