Создание проекта для профессионального голоса

Чтобы начать работу, вам потребуется всего несколько звуковых файлов и связанных с ними расшифровок. Проверьте, поддерживает ли пользовательский голос ваш язык и регион.

Начало точной настройки

На портале Microsoft Foundry можно точно настроить некоторые модели средств Foundry. Чтобы точно настроить профессиональную голосовую модель, выполните следующие действия.

  1. Перейдите к проекту Microsoft Foundry на портале Microsoft Foundry. Если вам нужно создать проект, см. статью "Создание проекта Microsoft Foundry".

  2. Выберите Тонкая настройка на левой панели.

  3. Выберите "Настройка службы ИИ"> и "+ Настроить".

    Снимок экрана: страница для выбора точной настройки моделей средств Foundry.

  4. В мастере выберите "Настраиваемый голос" (профессиональная настройка голоса).

  5. Нажмите кнопку Далее.

  6. Следуйте инструкциям, предоставленным визардом, чтобы создать пространство для тонкой настройки.

Продолжайте тонкую настройку

Перейдите к документации по службе Azure Speech в инструментах Foundry, чтобы узнать, как продолжить донастройку профессиональной голосовой модели.

Просмотр точно настроенных моделей

После точной настройки вы можете получить доступ к пользовательским моделям голосовой связи и развертываниям на странице точной настройки .

  1. Войдите на портал Microsoft Foundry.

  2. Выберите Тонкая настройка на левой панели.

  3. Выберите Тонкая настройка AI сервиса. Вы можете просмотреть состояние задач тонкой настройки и созданных моделей.

    Снимок экрана страницы для просмотра настроенных моделей инструментов Foundry Tools.

Следующий шаг

Содержимое для кастомного голоса, такого как данные, модели, тесты и конечные точки, организовано в проекты в Speech Studio. Каждый проект зависит от страны или региона и языка, а также пола создаваемого голоса. Например, вы можете создать проект женского голоса для чат-ботов центра обработки вызовов, в котором используется американский английский язык.

Чтобы начать работу, вам потребуется всего несколько звуковых файлов и связанных с ними расшифровок. Проверьте, поддерживает ли пользовательский голос ваш язык и регион.

Начало точной настройки

Чтобы точно настроить профессиональную голосовую модель, выполните следующие действия.

  1. Войдите в службу Speech Studio.

  2. Выберите подписку и ресурс службы "Речь" для работы.

    Внимание

    Обучение пользовательской голосовой связи в настоящее время доступно только в некоторых регионах. После обучения модели голоса в поддерживаемом регионе её можно скопировать в ресурс речевых служб в другом регионе при необходимости. Дополнительные сведения см. в сносках к таблице регионы.

  3. Выберите Пользовательский голос>Создать проект.

  4. Нажмите кнопку "Настраиваемый нейронный голос Pro>Далее".

  5. Выполните инструкции, предлагаемые мастером создания проекта.

Выберите новый проект по имени или щелкните Перейти к проекту. Эти пункты меню отображаются на левой панели: Настройка голосовых актеров, Подготовка обучающих данных, Обучение модели, и Развертывание модели.

Следующие шаги

Профессиональные проекты голосовой связи содержат заявление о согласии на голос, наборы данных для обучения, модели голосовой связи и конечные точки.

Каждый проект зависит от страны или региона и языка, а также пола создаваемого голоса. Например, вы можете создать проект женского голоса для чат-ботов центра обработки вызовов, в котором используется американский английский язык.

Создание проекта

Чтобы создать профессиональный проект голосовой связи, используйте Projects_Create операцию пользовательского API голосовой связи. Создайте текст запроса в соответствии со следующими инструкциями:

  • Задайте требуемому свойству kind значение ProfessionalVoice. Тип нельзя изменить позже.
  • При необходимости задайте locale свойство. Локаль этого проекта. Код локали соответствует BCP-47. Список локалей для текста в речь можно найти здесь. Если вы предоставите локаль, проект можно использовать в Speech Studio.
  • При необходимости задайте description свойство для описания проекта. Описание проекта можно изменить позже.

Выполните HTTP-запрос PUT с помощью URI, как показано в следующем Projects_Create примере.

  • Замените YourResourceKey ключом ресурса для распознавания речи.
  • Замените YourResourceRegion вашим регионом ресурса "Речь".
  • Замените ProjectId идентификатором проекта по вашему выбору. Идентификатор, чувствительный к регистру, должен быть уникальным в ресурсе синтеза речи. Идентификатор будет использоваться в URI проекта и не может быть изменен позже.
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
  "description": "Project description",
  "kind": "ProfessionalVoice",
  "locale": "en-US"
} '  "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/projects/ProjectId?api-version=2026-01-01"

Вы должны получить ответ в следующем формате:

{
  "id": "ProjectId",
  "description": "Project description",
  "kind": "ProfessionalVoice",
  "locale": "en-US",
  "createdDateTime": "2023-04-01T05:30:00.000Z"
}

Проект id используется в последующих запросах API, чтобы добавить согласие на использование голосового таланта и создать обучающий набор.

Следующие шаги