Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Облегченная версия пользовательского голоса — это тип проекта, который можно использовать для демонстрации и оценки пользовательского голоса перед тем, как инвестировать в профессиональные записи для создания более качественного голоса.
Внимание
Для демонстрации и оценки приложения не требуется. Однако корпорация Майкрософт ограничивает и выбирает образцы для записи и тестирования, которые используются с Custom Voice Lite. Для развертывания и использования пользовательской голосовой модели lite для бизнеса необходимо подать заявку на полный доступ к профессиональной настройке голоса. Запросите доступ с помощью формы приема.
Примечание.
Лёгкая пользовательская голосовая функция доступна только в Speech Studio. Он недоступен через портал Microsoft Foundry, REST API или пакеты SDK.
С помощью пользовательского проекта записи голоса в упрощенной версии, вы записываете свой голос онлайн, прочитав от 20 до 50 заранее определённых скриптов, которые предоставляет корпорация Майкрософт. После записи как минимум 20 образцов можно начать обучение модели. После успешного обучения модели можно просмотреть модель и извлечь 20 выходных образцов, созданных с помощью другого набора предварительно определенных сценариев.
См. поддерживаемые языки для пользовательского голоса.
Сравнение типов проектов
В следующей таблице приведены основные различия между пользовательской функцией Custom Voice Lite и профессиональной настройкой голоса.
| Элемент | Облегченное | Профессиональный |
|---|---|---|
| Целевые сценарии | Демонстрация или вычисление | Профессиональные сценарии, такие как озвучивание брендов и персонажей для чат-ботов или чтение аудиосодержимого. |
| Данные обучения | Запись в сети с помощью Speech Studio | Предоставление своих данных. Рекомендуется запись в профессиональной студии. |
| Скрипты для записи | Предоставлено в Speech Studio | Используйте собственные скрипты, которые соответствуют варианту использования. Корпорация Майкрософт предоставляет примеры скриптов для справки. |
| Требуемый размер данных | 20-50 речевых фрагментов | 300-2000 речевых фрагментов |
| Время обучения | Менее одного часа вычислений | Приблизительно 20-40 часов вычислений |
| Качество голоса | Среднее качество | Высокое качество |
| Доступность | Любой пользователь может записать образцы онлайн и обучить модель для демонстрации и оценки. Полный доступ к настраиваемому голосу требуется, если вы хотите развернуть облегченную модель настраиваемого голоса в коммерческих целях. | Отправка данных не ограничена, но вы можете настроить только профессиональный голос после утверждения доступа. Профессиональная настройка голоса ограничена на основе критериев приемлемости и использования. Запросите доступ в форме приема. |
| Цены | Цены за единицу одинаково применяются как для кастомной voice lite, так и для профессиональной настройки голоса. Ознакомьтесь данными на странице цен. | Цены за единицу одинаково применяются как для кастомной voice lite, так и для профессиональной настройки голоса. Ознакомьтесь данными на странице цен. |
Создание пользовательского проекта голосовой связи
Чтобы создать пользовательский проект lite голосовой связи, выполните следующие действия.
Войдите в службу Speech Studio.
Выберите подписку и ресурс службы "Речь" для работы.
Выберите .
Нажмите кнопку "Настраиваемый нейронный голос>" "Далее". Чтобы создать собственный профессиональный проект голосовой связи, ознакомьтесь с документацией по профессиональной настройке голоса.
Выполните инструкции, предлагаемые мастером создания проекта.
Внимание
Срок действия пользовательского проекта голосового lite истекает через 90 дней, если не будет отправлена словесная инструкция , записанная талантом голоса.
Выберите новый проект по имени или щелкните Перейти к проекту. Эти пункты меню отображаются на левой панели: запись и сборка, проверка модели и развертывание модели.
Запись и создание пользовательской облегчённой голосовой модели
Запишите по крайней мере 20 примеров голосовой связи (до 50) с предоставленными скриптами в Интернете. Примеры голосовых данных, записанные здесь, используются для создания искусственной версии голоса.
Примечание.
Обучение пользовательской голосовой связи в настоящее время доступно только в некоторых регионах. Дополнительные сведения см. в сносках к таблице регионы.
Ниже приведены некоторые советы, которые помогут вам записать примеры голосовой связи:
- Используйте хороший микрофон. Увеличьте ясность примеров с помощью высококачественного микрофона. Поговорите о 8 дюймах от микрофона, чтобы избежать шума рта.
- Избегайте фонового шума. Запись в тихой комнате без фонового шума или эхо.
- Расслабиться и поговорить естественно. Позвольте себе выразить эмоции, как вы читаете предложения.
- Запись за один взять. Чтобы обеспечить согласованный уровень энергии, запишите все предложения в одном сеансе.
- Проговорите каждое слово правильно и четко говорите.
Чтобы записать и создать лёгкую пользовательскую голосовую модель, выполните следующие действия в Speech Studio:
- Выберите "Пользовательская голосовая запись> " и "Запись проекта >" и "Сборка".
- Выберите Приступая к работе.
- Внимательно ознакомьтесь с условиями использования талантов голосовой связи. Установите флажок, чтобы подтвердить условия использования.
- Выберите команду Accept (Принять).
- Нажмите значок микрофона, чтобы запустить проверку шума. Эта проверка шума занимает всего несколько секунд, и вам не нужно говорить во время него.
- Если обнаружен шум, нажмите кнопку "Проверить снова", чтобы повторить проверку шума. Если шум не обнаружен, нажмите кнопку "Готово" , чтобы перейти к следующему шагу.
- Просмотрите советы по записи и выберите "Получил". Для получения наилучших результатов перейдите в тихую область без фонового шума перед записью ваших голосовых примеров.
- Нажмите значок микрофона, чтобы начать запись.
- Нажмите значок остановки, чтобы остановить запись.
- Просмотрите метрики качества. После записи каждого примера проверьте его метрики качества, прежде чем продолжать переход к следующему.
- Запишите дополнительные примеры. Хотя вы можете создать модель только с 20 примерами, рекомендуется записать до 50, чтобы повысить качество.
- Выберите "Обучение модели ", чтобы начать учебный процесс.
Процесс обучения занимает примерно один час вычислений. Ход обучения можно проверить на странице "Проверка модели ".
Проверка модели
Чтобы просмотреть пользовательскую упрощённую голосовую модель и прослушать собственный искусственный голос, выполните следующие действия.
- Выберите пользовательскую модель> проверки имени >проекта. Здесь можно просмотреть имя голосовой модели, язык модели, размер данных образца и ход обучения. Имя голоса состоит из слова "Нейронная", добавленного к имени проекта.
- Выберите имя голосовой модели, чтобы просмотреть сведения о модели и прослушивать пример текста в результаты речи.
- Выберите значок воспроизведения, чтобы услышать голосовые слова каждого скрипта.
Отправка словесного заявления
Словесная инструкция, записанная талантом голоса, требуется, прежде чем можно развернуть модель для вашего бизнеса.
Чтобы отправить словесное заявление о голосовом таланте, выполните следующие действия в Speech Studio:
- Выберите "Настраиваемый голос>" Имя >> голоса.
- Выберите модель.
- Введите имя голосового таланта и название компании.
- Чтение и запись инструкции. Щелкните значок микрофона, чтобы начать запись. Выберите значок остановки, чтобы остановить запись.
- Нажмите кнопку "Отправить ", чтобы отправить инструкцию.
- Проверьте состояние обработки в таблице скриптов в нижней части панели мониторинга. После успешного выполнения состояния можно развернуть модель.
Развертывание модели
Чтобы развернуть упрощенную пользовательскую модель голоса и использовать её в приложениях, необходимо получить полный доступ к системе пользовательских голосов. Запросите доступ в форме приема. В течение примерно 10 рабочих дней вы получаете сообщение электронной почты с состоянием утверждения. Словесное заявление , записанное талантом голоса, также требуется, прежде чем можно развернуть модель для вашего бизнеса.
Чтобы развернуть пользовательскую лайт-модель голоса, выполните следующие шаги в Speech Studio:
- Выберите ", имя >>".
- Выберите имя модели голосовой связи и нажмите кнопку "Далее".
- Введите имя и описание конечной точки, а затем нажмите кнопку "Далее".
- Установите флажок, чтобы согласиться с условиями использования, а затем нажмите кнопку "Далее".
- Выберите "Развернуть" , чтобы развернуть модель.
Здесь вы можете использовать облегченную пользовательскую модель голоса так же, как и профессиональную модель голоса. Например, можно приостановить или возобновить конечную точку после ее создания, чтобы ограничить расходы и сохранить ресурсы, которые не используются. Вы также можете получить доступ к голосу в средстве создания аудиоконтентов в Speech Studio.