Речь в тексте Azure

Речь в Azure позволяет создавать приложения и службы, которые естественно говорят с более чем 400 голосами на 140 языках и диалектах.

Этот соединитель доступен в следующих продуктах и регионах:

Услуга Class Регионы
Copilot Studio Премия Все регионы Power Automate , кроме следующих:
     — Облако Китая, управляемое 21Vianet
Логические приложения Стандарт Все регионы Logic Apps , кроме следующих:
     — Регионы Azure Для Китая
Power Apps Премия Все регионы Power Apps , кроме следующих:
     — Облако Китая, управляемое 21Vianet
Power Automate Премия Все регионы Power Automate , кроме следующих:
     — Облако Китая, управляемое 21Vianet
Контакт
Имя Команда службы "Речь" Power Platform
URL https://docs.microsoft.com/azure/cognitive-services/speech-service/support
Адрес электронной почты speechpowerplatform@microsoft.com
Метаданные соединителя
Publisher Microsoft
Веб-сайт https://docs.microsoft.com/azure/cognitive-services/speech-service/
Политика конфиденциальности https://privacy.microsoft.com
Категории Искусственный интеллект; Сайт

Служба "Речь" позволяет преобразовать текст в синтезированную речь и получить список поддерживаемых голосов для региона с помощью REST API.

Pre-requisites

Для продолжения вам потребуется следующее:

Создание подключения

Соединитель поддерживает следующие типы проверки подлинности:

Ключ API Ключ API (ApiKey) Все регионы Доступный для общего пользования
Интегрированный идентификатор Microsoft Entra Используйте идентификатор Microsoft Entra для доступа к службе распознавания речи. Все регионы, кроме Azure для государственных организаций и министерства обороны (DoD) в Azure для государственных организаций и государственных организаций США (GCC-High) Недоступен для совместного использования
Интегрированная идентификатора Microsoft Entra (Azure для государственных организаций) Используйте идентификатор Microsoft Entra для доступа к службе распознавания речи. Azure для государственных организаций и Министерства обороны (DoD) в Azure для государственных организаций и государственных организаций США (GCC-High) только Недоступен для совместного использования
По умолчанию [не рекомендуется] Этот параметр предназначен только для старых подключений без явного типа проверки подлинности и предоставляется только для обратной совместимости. Все регионы Недоступен для совместного использования

Ключ API

Идентификатор проверки подлинности: keyBasedAuth

Применимо: все регионы

Ключ API (ApiKey)

Это совместное подключение. Если приложение power app предоставлено другому пользователю, подключение также предоставляется совместно. Дополнительные сведения см. в обзоре соединителей для приложений на основе холста — Power Apps | Документация Майкрософт

Имя Тип Description Обязательно
Ключ учетной записи securestring Ключ службы "Речь" True
Регион струна Регион службы "Речь" (пример: eastus) True

Microsoft Entra id Integrated

Идентификатор проверки подлинности: tokenBasedAuth

Применимо: все регионы, кроме Azure для государственных организаций и министерства обороны (DoD) в Azure для государственных организаций и государственных организаций США (GCC-High)

Используйте идентификатор Microsoft Entra для доступа к службе распознавания речи.

Это недоступно для общего доступа. Если приложение power предоставляется другому пользователю, пользователю будет предложено явно создать новое подключение.

Имя Тип Description Обязательно
ИД ресурса струна Идентификатор ресурса cognitive services (пример: /subscriptions/<Subscription ID>/resourceGroups/<ResourceGroup Name>/providers/Microsoft.CognitiveServices/accounts/CognitiveServices/<Имя ресурса> CognitiveServices) True
Настраиваемый поддомен струна URL-адрес пользовательской конечной точки поддомена (пример: contoso) True

Интегрированная идентификатора Microsoft Entra (Azure для государственных организаций)

Идентификатор проверки подлинности: tokenBasedAuth

Применимо: Только Для государственных организаций Azure и Министерства обороны (DoD) в Azure для государственных организаций и государственных организаций США (GCC-High)

Используйте идентификатор Microsoft Entra для доступа к службе распознавания речи.

Это недоступно для общего доступа. Если приложение power предоставляется другому пользователю, пользователю будет предложено явно создать новое подключение.

Имя Тип Description Обязательно
ИД ресурса струна Идентификатор ресурса cognitive services (пример: /subscriptions/<Subscription ID>/resourceGroups/<ResourceGroup Name>/providers/Microsoft.CognitiveServices/accounts/CognitiveServices/<Имя ресурса> CognitiveServices) True
Настраиваемый поддомен струна URL-адрес пользовательской конечной точки поддомена (пример: contoso) True

По умолчанию [не рекомендуется]

Применимо: все регионы

Этот параметр предназначен только для старых подключений без явного типа проверки подлинности и предоставляется только для обратной совместимости.

Это недоступно для общего доступа. Если приложение power предоставляется другому пользователю, пользователю будет предложено явно создать новое подключение.

Имя Тип Description Обязательно
Ключ учетной записи securestring Ключ учетной записи Azure Cognitive Services для нейронного текста в речь True
Регион струна Регион службы "Речь" (пример: eastus) True

Ограничения регулирования

Имя Вызовы Период обновления
Вызовы API для каждого подключения 100 60 секунд

Действия

Получение списка голосов

Получение полного списка голосов для определенного региона или конечной точки.

Преобразование текста в речь

Преобразование одного текста в речь.

Преобразование текста в речь с помощью SSML

Преобразование текста в речь с помощью языка разметки синтеза речи (SSML)

Получение списка голосов

Получение полного списка голосов для определенного региона или конечной точки.

Возвращаемое значение

Имя Путь Тип Описание
array of object
items
object

массив

Преобразование текста в речь

Преобразование одного текста в речь.

Параметры

Имя Ключ Обязательно Тип Описание
Имя голоса
voiceName True string

Выходные данные голосового имени для текста в речь. Например, en-US-JennyNeural.

Региональные настройки
locale True string

Языковой стандарт содержащихся данных. Например, en-US.

Синтезированный текст
synthesizedText True string

Синтезированный текст, который необходимо преобразовать в речь.

Формат выходного звука
outputFormat string

Форматы аудио без потоковой передачи. По умолчанию: riff-24khz-16bit-mono-pcm.

Style
style string

Экспресс-стиль речи. Например: веселый.

Скорость речи
speakingRate string

Скорость речи. Например: -40.00%.

Преобразование текста в речь с помощью SSML

Преобразование текста в речь с помощью языка разметки синтеза речи (SSML)

Параметры

Имя Ключ Обязательно Тип Описание
Текст SSML
ssmlText True string

Текст в формате SSML (например <, говоря xmlns='http://www.w3.org/2001/10/synthesis' xmlns:mstts='http://www.w3.org/2001/mstts' xmlns:emo='http://www.w3.org/2009/10/emotionml' version='1.0' xml:lang='en-US'><voice name='en-US-ChristopherNeural'power> connector</voice></speak>)

Формат выходного звука
outputFormat string

Форматы аудио без потоковой передачи. По умолчанию: riff-24khz-16bit-mono-pcm.