Примечание
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
В этой статье описываются языковые параметры индексатора видео и приведен список поддержки языка для каждого из них. Он включает языки, поддерживаемые функциями Индексатора видео, переводом, идентификацией языка, настройкой и параметрами языка веб-сайта Индексатора видео.
Поддерживаемые языки для каждого сценария
В этом разделе описаны параметры языка индексатора видео и таблица поддерживаемых языков для каждого из них.
Внимание
- При индексировании с помощью Индексатора видео Azure все языки, перечисленные в списке, поддерживают преобразование при индексировании через API.
- Если индексирование производится с помощью Индексатора видео Azure AI, активированного Arc, через веб-приложение или API, поддерживается только перевод на английский язык.
Объяснения столбцов
Поддерживаемый исходный язык — язык , который говорится в файле мультимедиа, поддерживаемый для транскрибирования, перевода и поиска.
Идентификация языка. Может ли язык автоматически обнаруживаться индексатором видео при использовании идентификации языка для индексирования. Для получения дополнительной информации см. Использование Индексатора видео Azure AI для автоматической идентификации языков и раздел Идентификация языка.
Настройка (языковая модель) — можно ли использовать язык при настройке языковых моделей в Индексаторе видео. Дополнительные сведения см. в статье "Настройка языковой модели" в Индексаторе видео в Azure AI.
Произношение (языковая модель) — можно ли использовать язык для создания набора данных произношения в рамках пользовательской модели речи. Дополнительные сведения см. в статье "Настройка модели распознавания речи с помощью индексатора видео Azure AI".
Перевод веб-сайта – Поддерживается ли язык для перевода на сайте Azure AI Video Indexer. Выберите переведенный язык в раскрывающемся меню языка.
Перечисленные ниже сведения были переведены.
- Запись
- Ключевые слова
- Темы
- Наклейки
- Рамочные шаблоны (в настоящий момент только на иврит)
Все остальные сведения отображаются по-английски при использовании перевода.
Язык веб-сайта. Можно ли выбрать язык для использования на веб-сайте Индексатора видео Azure. Щелкните значок "Параметры", а затем выберите язык в раскрывающемся списке "Параметры языка".
Язык | Код |
Поддерживается исходный язык |
Поддерживается исходный язык (Arc) |
Язык идентификация |
Настройка (языковая модель) |
Произношение (языковая модель) |
Сайт Перевод |
Сайт Язык |
---|---|---|---|---|---|---|---|---|
Африкаанс | af-ZA | ✔ | ||||||
Арабский (Израиль) | ar-IL | ✔ | ✔ | ✔ | ||||
Арабский (Ирак) | ar-IQ | ✔ | ✔ | ✔ | ||||
Арабский (Иордания) | ar-JO | ✔ | ✔ | ✔ | ✔ | |||
Арабский (Кувейт) | ar-KW | ✔ | ✔ | ✔ | ✔ | |||
Арабский (Ливан) | ar-LB | ✔ | ✔ | ✔ | ||||
Арабский (Оман) | ar-OM | ✔ | ✔ | ✔ | ✔ | |||
Арабский (Палестинская Автономия) | ar-PS | ✔ | ✔ | ✔ | ||||
Арабский (Катар) | ar-QA | ✔ | ✔ | ✔ | ✔ | |||
Арабский (Саудовская Аравия) | ar-SA | ✔ | ✔ | ✔ | ✔ | |||
Арабский (Объединенные Арабские Эмираты) | ar-AE | ✔ | ✔ | ✔ | ✔ | |||
Арабский (Египет) | ar-EG | ✔ | ✔ | ✔ | ✔ | ✔ | ||
Современный стандартный арабский язык (Бахрейн) | ar-BH | ✔ | ✔ | ✔ | ✔ | |||
Арабский (Сирийская Арабская Республика) | ar-SY | ✔ | ✔ | ✔ | ✔ | |||
Армянский | hy-AM | ✔ | ✔ | |||||
Бенгальский | bn-BD | ✔ | ✔ | |||||
Боснийский | bs-Latn | ✔ | ||||||
Болгарский | bg-BG | ✔ | ✔ | ✔ | ✔ | |||
Каталанский | ca-ES | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |
Кантонский диалект китайского языка (традиционное письмо) | zh-HK | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |
Китайский (упрощенный) | zh-Hans | ✔ | ✔ | ✔ | ✔ | ✔ | ||
Китайский (упрощенный) | zh-CK | ✔ | ✔ | ✔ | ✔ | ✔ | ||
Китайский (традиционный) | zh-Hant | ✔ | ✔ | |||||
Хорватский | hr-HR | ✔ | ✔ | ✔ | ✔ | ✔ | ||
Чешский | cs-CZ (чешский язык) | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Датский | da-DK | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |
Голландский | nl-NL | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Английский (Австралия) | en-AU | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |
Английский (Великобритания) | английский (Великобритания) | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |
Английский язык, США | en-US | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Эстонский | et-EE | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |
Фиджи | en-FJ | ✔ | ||||||
Филиппинский | fil-PH | ✔ | ✔ | |||||
Финский | fi-FI | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |
Французский | fr-FR | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |
французский (Канада) | fr-CA | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Немецкий | de-DE | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Греческий | el-GR | ✔ | ✔ | ✔ | ✔ | |||
Гуджарати | gu-IN | ✔ | ✔ | ✔ | ||||
Гаитянский | fr-HT | ✔ | ||||||
Иврит | he-IL | ✔ | ✔ | ✔ | ✔ | ✔ | ||
Хинди | Привет | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |
Венгерский | hu-HU | ✔ | ✔ | ✔ | ✔ | ✔ | ||
Исландский | is-IS | ✔ | ✔ | |||||
Индонезийский | id-ID | ✔ | ✔ | ✔ | ✔ | |||
Ирландский | ga-IE | ✔ | ✔ | ✔ | ✔ | |||
Итальянский | it-IT | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Японский | ja-JP | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |
Каннада | kn-IN | ✔ | ✔ | |||||
Суахили | sw-KE | ✔ | ||||||
Корейский | ko-KR | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |
Латышский | lv-LV | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |
Литовский | lt-LT | ✔ | ✔ | ✔ | ✔ | |||
Малагасийский | mg-MG | ✔ | ||||||
Малайский | ms-MY | ✔ | ✔ | ✔ | ||||
Малаялам | ml-IN | ✔ | ✔ | ✔ | ||||
Мальтийский | mt-MT | ✔ | ||||||
Норвежский | nb-NO | ✔ | ✔ | ✔ | ✔ | ✔ | ||
Персидский | fa-IR | ✔ | ✔ | ✔ | ✔ | |||
Польский | pl-PL | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Португальский | Португальский-Бразильский (pt-BR) | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Португальский (Португалия) | pt-PT | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |
Румынский | ro-RO | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |
русский | ru-RU | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |
Самоанский | en-WS | |||||||
Сербский (кириллица) | sr-Cyrl-RS | ✔ | ||||||
Сербский (латиница) | sr-Latn-RS | ✔ | ||||||
Словацкий | ск-СК | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |
Словенский | sl-SI | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |
Испанский | es-ES | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Испанский (Мексика) | es-MX | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |
Шведский | sv-SE | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Тамильский | та-ИН | ✔ | ✔ | ✔ | ✔ | |||
Телугу | te-IN | ✔ | ✔ | ✔ | ||||
Тайский | th-TH | ✔ | ✔ | ✔ | ✔ | ✔ | ||
Тонганский язык | to-TO | ✔ | ||||||
Турецкий | tr-TR | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |
Украинский | uk-UA | ✔ | ✔ | ✔ | ✔ | |||
Урду | ur-PK | ✔ | ||||||
Вьетнамский | vi-VN | ✔ | ✔ | ✔ | ✔ |
Получение поддерживаемых языков через API
Используйте вызов API получения поддерживаемых языков для извлечения полного списка поддерживаемых языков в каждой области. Дополнительные сведения см. в разделе "Получение поддерживаемых языков".
API возвращает список поддерживаемых языков со следующими значениями:
{
"name": "Language",
"languageCode": "Code",
"isRightToLeft": true/false,
"isSourceLanguage": true/false,
"isAutoDetect": true/false
}
Поддерживаемый исходный язык:
Если
isSourceLanguage
значение равно false, язык поддерживается только для перевода. ЕслиisSourceLanguage
задано значение true, язык поддерживается в качестве источника для транскрибирования, перевода и поиска.Идентификация языка (автоматическое обнаружение):
Если
isAutoDetect
задано значение true, язык поддерживается для идентификации языка (LID) и многоязычной идентификации (MLID).
Идентификация языка
При отправке файла мультимедиа в Индексатор видео можно указать исходный язык файла мультимедиа. Если индексировать файл с помощью веб-сайта Индексатора видео, его можно сделать, выбрав язык во время отправки файла. Если вы отправляете задание индексирования через API, оно выполняется с помощью параметра языка. Затем выбранный язык используется для создания транскрибирования файла.
Если вы не уверены в языке источника медиафайла или он может содержать несколько языков, Video Indexer может обнаружить устные языки. Если для исходного языка файла мультимедиа выбрано автоматическое определение одного языка (LID) или многоязычный (MLID), обнаруженный язык или языки используются для транскрибирования файла мультимедиа. Дополнительные сведения о LID и MLID см. в статье "Использование индексатора видео в Azure AI для автоматического идентификации языков", см. в статье "Автоматическое определение языка с помощью модели идентификации языка" и автоматическое определение и транскрибирование мультиязычного содержимого
Существует ограничение в 10 языков, разрешенных для идентификации во время индексирования файла мультимедиа для LID и MLID. Ниже приведены девять языков по умолчанию для идентификации языка (LID) и многоязычной идентификации (MILD):
- Немецкий (de-DE)
- Английский язык (США) (en-US)
- Испанский (es-ES)
- Французский (fr-FR)
- Итальянский (it-IT)
- Японский (ja-JP)
- Португальский (pt-BR)
- Русский (ru-RU)
- Китайский (упрощённый) (zh-Hans)
Изменение списка языков по умолчанию
Если вам нужно использовать языки для идентификации, которые не используются по умолчанию, можно настроить список на любом из 10 языков, поддерживающих настройку с помощью веб-сайта или API:
Изменение списка с помощью веб-сайта
Выберите вкладку "Идентификатор языка" в разделе "Настройка модели". Список языков зависит от используемой учетной записи Индексатора видео и для пользователя, вошедшего в систему. Список языков по умолчанию сохраняется на пользователя на локальном устройстве, на каждом устройстве и браузере. В результате каждый пользователь может настроить собственный список языков, определенный по умолчанию.
Используйте добавление языка для поиска и добавления дополнительных языков. Если 10 языков уже выбраны, перед добавлением нового необходимо удалить один из существующих обнаруженных языков.
Изменение списка с помощью API
При отправке файла модель языка Индексатора видео перекрестно ссылается на девять языков по умолчанию. При наличии совпадения модель создает транскрибирование для файла с обнаруженным языком.
Используйте параметр языка для указания multi
параметров (MLID) или auto
(LID).
customLanguages
Используйте параметр, чтобы указать до 10 языков. (Параметр используется только в том случае, если параметр языка установлен на значение multi
или auto
.) Чтобы узнать больше об использовании API, см. статью Использование API индексатора видео Azure AI.