Поделиться через


Настройте речевую модель

Примечание

Настройка модели речи, включая обучение произношения, доступна в пробных учетных записях Индексатора видео Azure и учетных записях Resource Manager. Классические учетные записи не поддерживают эту функцию. Сведения об использовании пользовательского языка см. в статье "Настройка языковой модели".

Azure AI Video Indexer позволяет создавать настраиваемые модели речи для персонализации распознавания речи, загружая наборы данных, которые используются для создания модели речи. Эта статья объясняет шаги на сайте Video Indexer, чтобы достичь этого. Вы также можете использовать API, как описано в разделе "Настройка модели речи" с помощью API.

Подробные сведения и рекомендации для пользовательских моделей речи см. в статье "Настройка модели распознавания речи с помощью Индексатора видео в Azure AI".

Предпосылки

Создание набора данных

Так как все пользовательские модели должны содержать набор данных, начните с процесса создания наборов данных и управления ими.

  1. Нажмите кнопку настройки модели .
  2. Выберите вкладку Речь (новое).
  3. Выберите "Отправить набор данных".
  4. Выберите либо Простой текст, либо Произношение в выпадающем меню Тип набора данных. Каждый модель распознавания речи должна иметь набор данных с текстами, и при необходимости может содержать набор данных с произношениями.
  5. Выберите Browse и выберите файл набора данных. Вы можете выбрать только один.
  6. Выберите язык для модели. Выберите язык, который говорится в файлах мультимедиа, которые планируется индексировать с помощью этой модели. Имя набора данных предварительно заполнено именем файла, но его можно изменить.
  7. При необходимости можно добавить описание набора данных. Это может быть полезно для различения каждого набора данных, если ожидается несколько наборов данных.
  8. Выберите Загрузить. Когда создание набора данных завершено, вы можете использовать его для обучения и создания новых моделей.

Проверить и обновить набор данных

Набор данных и его свойства можно просмотреть следующими способами:

  • Щелкнув по имени набора данных
  • Наведение курсора на набор данных
  • Выбор многоточия

Затем выберите Просмотр набора данных.

Затем можно просмотреть имя, описание, язык и состояние набора данных, а также следующие свойства:

Количество строк: указывает количество строк, успешно загруженных из общего числа строк в файле. Если весь файл загружен успешно, совпадение чисел (например, 10 из 10 нормализовано). Если числа не совпадают (например, 7 из 10 нормализованных), это означает, что только некоторые строки успешно загружены и остальные имели ошибки. Общие причины ошибок связаны с проблемами форматирования строки, например, отсутствием табуляции между каждым словом в файле с произношением. Проверка простого текста и данных о произношении для учебных статей должна помочь в обнаружении проблемы. Чтобы устранить проблему, просмотрите сведения об ошибке, содержащиеся в отчете. Выберите Просмотр отчёта, чтобы просмотреть детали ошибки, связанные со строками, которые не удалось загрузить успешно (errorKind). Вы также можете просмотреть ее, выбрав вкладку "Отчет ".

Идентификатор набора данных: каждый набор данных имеет уникальный GUID, который необходим при использовании API для операций, ссылающихся на набор данных.

Обычный текст (нормализованный) — содержит нормализованный текст загруженного файла набора данных. Нормализованный текст — это распознанный текст в незамысловатой форме без форматирования.

Изменить детали: Чтобы изменить имя или описание набора данных, наведите курсор на набор данных, выберите многоточие, а затем выберите Изменить детали. Затем вы сможете изменить название набора данных и его описание.

Примечание

Данные в наборе данных не могут быть отредактированы или обновлены после загрузки набора данных. Если вам нужно отредактировать или обновить данные в наборе данных, сначала загрузите этот набор, выполните изменения, сохраните файл и загрузите обновленный файл набора данных.

Скачать: чтобы скачать файл набора данных, при наведении указателя мыши на набор данных выберите многоточие и нажмите кнопку "Скачать". В качестве альтернативы, при просмотре набора данных вы можете выбрать загрузку и затем выбрать между скачиванием файла набора данных или отчета о загрузке в формате JSON.

Удаление. Чтобы удалить набор данных, при наведении указателя мыши на набор данных выберите многоточие и нажмите кнопку "Удалить".

Создать пользовательскую модель речи

Наборы данных используются в создании и обучении моделей. После создания набора данных обычного текста можно создать и начать работу с пользовательской моделью речи.

При создании и использовании пользовательских моделей речи следует учитывать следующие моменты:

  • Новая модель должна включать по крайней мере один набор данных в текстовом формате и может иметь несколько наборов данных в текстовом формате.
  • Включение набора данных с произношением необязательно, и может быть включён не более одного.
  • После создания модели нельзя добавлять в нее дополнительные наборы данных или вносить изменения в наборы данных. Если вам нужно добавить или изменить наборы данных, создайте новую модель.
  • Если вы индексируете видео с помощью пользовательской модели речи, а затем удаляете модель, это не повлияет на расшифровку, если вы не выполняете повторную индексацию.
  • Если вы удалили набор данных, используемый для обучения пользовательской модели, он продолжает использовать его до удаления модели речи. Причина заключается в том, что модель речи была обучена набором данных.
  • Если удалить пользовательскую модель, это не влияет на транскрибирование видеороликов, которые уже были индексированы с помощью модели.

Обучить модель

Примечание

Как только модель создана, наборы данных не могут быть добавлены. Модель может содержать только наборы данных одного языка.

Есть два способа обучить модель — через вкладку данных и через вкладку модели.

Обучение модели с помощью вкладки "Наборы данных"

  1. Просмотрите список наборов данных.
  2. Выберите набор данных в виде простого текста. Затем выберите символ "Обучение новой модели ".
  3. Выберите Обучить новую модель.
  4. Введите название для модели, язык, и при желании добавьте описание.
  5. Выберите вкладку Наборы данных
  6. Выберите наборы данных, которые нужно включить в модель.
  7. Выберите Создать и обучить.

Обучение модели с помощью вкладки "Модели"

  1. Перейдите на вкладку "Модели ".
  2. Выберите значок обучить новую модель.
  3. Выберите наборы данных, которые вы хотите включить в модель.
  4. Введите название для модели, язык, и при желании добавьте описание.
  5. Перейдите на вкладку "Наборы данных ".
  6. Выберите наборы данных, которые нужно включить в модель.
  7. Выберите Создать и обучить.

Просмотрите и обновите модель

Просмотр модели. Вы можете просматривать модель и ее свойства, выбрав имя модели или наведите указатель мыши на модель. Затем выберите многоточие (...), а затем выберите "Модель представления".

Затем на вкладке "Сведения" отображается имя, описание, язык и состояние модели, а также следующие свойства:

Идентификатор модели. Каждая модель имеет уникальный GUID, который необходим при использовании API для операций, ссылающихся на модель.

Создано: дата создания модели.

Изменить детали: Чтобы изменить имя или описание модели, наведите курсор на модель, выберите многоточие, а затем выберите Изменить детали. Затем вы сможете отредактировать название и описание модели.

Примечание

Изменить можно только название и описание модели. Если вы хотите внести изменения в его наборы данных или добавить новые наборы данных, необходимо создать новую модель.

Удаление. Чтобы удалить модель, при наведении указателя мыши на набор данных выберите многоточие и нажмите кнопку "Удалить".

Включенные наборы данных: выберите на вкладке "Включенные наборы данных", чтобы просмотреть наборы данных модели.

Используйте пользовательскую языковую модель при индексации видео

Для задач индексирования по умолчанию не используется пользовательская языковая модель, поэтому её необходимо выбрать во время загрузки индекса.

  1. Во время процесса загрузки выберите источник вашей пользовательской языковой модели из раскрывающегося списка language.
  2. Выберите Загрузить.

Те же шаги применимы, когда вы хотите переиндексировать видео с помощью пользовательской модели.