Поделиться через


Руководство по настройке индексирования

Вы можете использовать параметры индексирования по умолчанию или настроить их. Вы можете выбрать язык, индексирование, пользовательские модели и параметры потоковой передачи, которые влияют на аналитические сведения, созданные, затраты и производительность.

В этой статье описаны все варианты. Те же параметры применяются при использовании веб-сайта Индексатора видео Azure, что и для использования API (см. руководство по API). При индексировании больших томов следуйте руководству по масштабируемой шкале.

Параметры по умолчанию

По умолчанию индексатор видео Azure AI настроен следующим образом:

  • Исходный язык: английский
  • Конфиденциальность: частная
  • Настройка аудио и видео: стандартный
  • Качество потоковой передачи: однократная скорость

Исходный язык видео

Если вы знаете язык, который говорился в видео, выберите язык из списка исходного видео. Если вы не уверены в языке видео, выберите автоматическое обнаружение одного языка. Индексатор видео Azure AI использует идентификацию языка (LID) для обнаружения языка видео и создания транскрибирования и аналитических сведений с обнаруженным языком.

Если видео содержит несколько языков, и вы не уверены, какие из них, выберите автоматическое обнаружение нескольких языков. В этом случае при отправке и индексировании видео применяется обнаружение с несколькими языками (MLID).

Хотя автоматическое определение является отличным вариантом, когда язык в видео отличается, при использовании LID или MLID следует учитывать два пункта:

  • LID/MLID не поддерживает все языки, поддерживаемые Индексатором видео Azure AI.
  • Транскрибирование имеет более высокое качество при предварительном выборе соответствующего языка видео.

Дополнительные сведения о поддержке языка и поддерживаемых языках.

Конфиденциальность

Этот параметр позволяет определить, должна ли аналитика быть доступна только пользователям в учетной записи Индексатора видео Azure AI или любому пользователю со ссылкой.

Параметры индексирования

При использовании параметров индексирования по умолчанию каждый из вариантов индексирования аудио и видео может быть по-разному оценен. Дополнительные сведения см . в ценах на индексатор видео Azure AI.

Ниже приведены параметры типа индексирования с подробными сведениями об их аналитических сведениях. Чтобы изменить тип индексирования, выберите дополнительные параметры.

Примечание.

Оптическое распознавание символов (OCR) используется с несколькими типами аналитических сведений.

Расширенные настройки

Только аудиоданные

  • Базовый: индексирует и извлекает аналитические сведения только с помощью звука (игнорируя видео) и предоставляет следующие аналитические сведения: транскрибирование, перевод, форматирование заголовков выходных данных и субтитров (закрытые субтитры).
  • Стандартный: индексирует и извлекает аналитические сведения только с помощью звука (игнорируя видео) и предоставляет следующие аналитические сведения: транскрибирование, перевод, форматирование субтитров и субтитров (закрытые субтитры), автоматическое распознавание речи, эмоции, ключевые слова, именованные сущности (бренды, расположения, люди), тональности, динамики, извлечение тем и текстовый кон режим палатки ration.
  • Дополнительно: индексирует и извлекает аналитические сведения только с помощью звука (игнорируя видео) и предоставляет следующие аналитические сведения: транскрибирование, перевод, форматирование субтитров и субтитров (закрытые субтитры), автоматическое обнаружение речи, обнаружение аудио, распознавание звука, ключевые слова, именованные сущности (бренды, расположения, люди), тональности, динамики, извлечение тем и текстовый конкон режим палатки ration.

Только видео

  • Базовый: индексирует и извлекает аналитические сведения только с помощью видео (игнорирует звук) и предоставляет следующие аналитические сведения: метки, обнаружение объектов, OCR, сцены (ключевые кадры и снимки), а также обнаружение черных кадров.
  • Стандартный: индексирует и извлекает аналитические сведения только с помощью видео (игнорируя звук) и предоставляет следующие аналитические сведения: метки (OCR), именованные сущности (OCR - бренды, места, люди), OCR, люди, сцены (ключевые кадры и снимки), черные кадры, визуальные кон режим палатки мерация и извлечение разделов (OCR).
  • Дополнительно. Индексирует и извлекает аналитические сведения только с помощью видео (игнорируя звук) и предоставляет следующие аналитические сведения: метки (OCR), соответствующие лица, именованные сущности (OCR - бренды, расположения, OCR), OCR, наблюдаемые люди, сцены, сцены (ключевые кадры и снимки), обнаружение цифровых шаблонов, обнаружение цифровых шаблонов, анализ одежды, обнаружение без текста, обнаружение текстового логотипа, обнаружение текстовых логотипов, черные кадры, визуальное кон режим палатки мерация и извлечение тем (OCR).

Звук и видео

  • Базовый: индексирует и извлекает аналитические сведения с помощью звука и видео и предоставляет следующие аналитические сведения: транскрибирование, перевод, форматирование заголовков и субтитров (закрытые субтитры), обнаружение объектов, OCR, сцены (ключевые кадры и снимки) и черные кадры.
  • Стандартный: индексирует и извлекает аналитические сведения с помощью аудио и видео и предоставляет следующие аналитические сведения: транскрибирование, преобразование, форматирование субтитров и субтитров (закрытые субтитры), автоматическое распознавание речи, эмоции, ключевые слова, именованные сущности (бренды, расположения, люди), OCR, сцены (ключевые кадры и снимки), черные кадры, визуальный кон режим палатки ration, люди, тональность, динамики, извлечение темы и текстовый конуальныйрежим палатки.
  • Дополнительно: индексирует и извлекает аналитические сведения с помощью аудио и видео и предоставляет следующие аналитические сведения: транскрибирование, перевод, форматирование субтитров и субтитров (закрытые субтитры), автоматическое распознавание речи, текстовое кон режим палатки ration, обнаружение звуковых событий, эмоции, ключевые слова, соответствующие лица, именованные сущности (бренды, расположения, люди), OCR, наблюдаемые люди, обнаружение доски clapper, обнаружение цифровых шаблонов, функция одежды аналитические сведения, обнаружение без текста, тональность, динамики, сцены (ключевые кадры и снимки), обнаружение текстового логотипа, черные кадры, визуальный кон режим палатки мерация и извлечение тем.

Параметры качества потоковой передачи

Существует два варианта потоковой передачи индексированных видео:

  • Единая скорость: если высота видео больше или равна 720p HD, индексатор видео Azure AI кодирует его с разрешением 1280 x 720. В противном случае оно будет кодироваться с разрешением 640 x 468.
  • Нет потоковой передачи: аналитика создается, но потоковая передача не выполняется, и видео недоступно на веб-сайте Индексатора видео Azure. Если потоковая передача не выбрана, плата за кодировку не взимается.

Исключение моделей

Можно исключить модели при индексировании с помощью веб-сайта VI и API. При отправке видео для индексирования с помощью веб-сайта выберите предустановки расширенных параметров>индексирования, а затем выберите модели ИИ, которые будут исключены из результатов индексирования. Это может обеспечить более эффективное индексирование и результаты VI, содержащие только интересующие вас аналитические сведения.

Настройка моделей содержимого

Индексатор видео Azure позволяет настроить некоторые модели для адаптации к конкретному варианту использования. К этим моделям относятся бренды, язык, человек и речь.

Аналитика и хранилище мультимедиа

Хранилище аналитических сведений

Все аналитические сведения и метаданные индексирования хранятся в учетных записях хранения, управляемых VI, и плата за это хранилище не взимается.

Хранилище носителей

Ваша учетная запись VI подключена к учетной записи служба хранилища Azure. Вы контролируете и оплачиваете использование этой учетной записи хранения. Следующие файлы хранятся в этой учетной записи при индексировании видео:

  • Исходный файл. Он хранится в случае, если вы хотите переиндексировать видео в будущем.
  • Новый закодированный файл, если для качества потоковой передачи задано однократное значение битовой скорости.

Удаление носителя

Индексированный носитель и все связанные с ним файлы и аналитические сведения можно удалить тремя способами:

  1. Удалите файлы с помощью портала Индексатора видео.
  2. Используйте запрос на удаление видео или удаление исходного файла видео.
  3. Если исходный файл мультимедиа не требуется хранить в хранилище, при использовании API задайте retentionPeriod для параметра значение от 1 до 7. Индексированное видео и все, связанное с ним, исходный файл, аналитические сведения и т. д. удаляются через 1–7 дней после индексирования.