Что такое видеоперевод?

Перевод видео — это функция Azure Speech в составе Foundry Tools, которая позволяет беспрепятственно и автоматически переводить и создавать видео на нескольких языках. Эта функция предназначена для локализации видеосодержимого для поддержки различных аудиторий по всему миру. Вы можете эффективно создавать иммерсивные, локализованные видео в различных вариантах использования, таких как vlogs, education, news, enterprise training, реклама, фильм, телевизионные шоу и многое другое.

Процесс замены оригинального языка видео на речь, записанную на другом языке, необходим для удовлетворения потребностей различных аудиторий. Этот метод, как правило, достигается с помощью человеческой записи и ручной последующей работы, гарантирует, что зрители могут наслаждаться видеоконтентом на собственном языке. Тем не менее, это сопровождается ключевыми проблемами.

  • Высокая стоимость: традиционные методы перевода видео часто требуют дорогих человеческих голосовых актеров и обширных пост-производственных работ, что делает его дорогостоящим усилием для создателей содержимого.
  • Трудоёмкость: Процесс записи и редактирования переведённой речи вручную может занять много времени, задерживая выпуск локализованного контента.
  • Несогласованное качество: человеческие голосовые актеры могут не всегда точно реплицировать голос исходного говорящего, что приводит к менее иммерсивному опыту для зрителей.

С помощью перевода видео в Azure Speech эти задачи эффективно решаются. Эта функция автоматизирует процесс перевода, значительно сокращая затраты и рабочее время, обеспечивая высококачественные результаты. Точное репликация голоса исходного говорящего создает простой и иммерсивный интерфейс просмотра для аудиторий по всему миру.

  • Экономичность: снижает потребность в дорогостоящих актерах голоса человека и ручной постпроизводской работе.
  • Экономия времени: значительно сокращает время, необходимое для создания локализованных видео.
  • Высокое качество: точно реплицирует голос исходного говорящего, обеспечивая простое и иммерсивное взаимодействие с просмотром.
  • Масштабируемость. Позволяет быстро и эффективно создавать большие объемы локализованного содержимого.

Вариант использования

Видеотрансляции, предоставляемые Azure Speech, имеют широкий спектр вариантов использования в различных отраслях и типах контента. Ниже приведены некоторые ключевые приложения:

  • Новости и интервью: Новостные организации могут переводить и дублировать сегменты новостей и интервью, чтобы обеспечить точную и своевременную информацию для аудиторий во всем мире.

  • Реклама и маркетинг: предприятия могут локализовать свои рекламные и маркетинговые видео, чтобы пересонировать с целевыми аудиториями на разных рынках, повышая осведомленность бренда и взаимодействие с клиентами.

  • Образование и обучение: образовательные учреждения и платформы электронного обучения могут озвучить свои обучающие видео и лекции на разных языках, что делает обучение более доступным и включающим.

  • Фильм + тв-шоу: Киностудии и производственные компании могут озвучить свои фильмы и телевизионные шоу для международного распространения, достичь более широкой аудитории и максимизировать потенциал доходов.

  • Vlog + короткое видео: владельцы контента могут легко переводить и дублировать свои vlogs и короткие видео, чтобы достичь международной аудитории, расширяя их зрительство и участие.

  • Обучение предприятия: корпорации могут локализовать обучающие видео для сотрудников в разных регионах, обеспечивая последовательную и эффективную связь между своими сотрудниками.

Основные возможности

  • Извлечение звука диалога и транскрибирование речевых материалов.

    Автоматически извлекает звук диалога из исходного видео и транскрибирует реченное содержимое.

  • Преобразование с языка A на B и большую языковую модель (LLM).

    Преобразует транскрибированное содержимое с исходного языка (Язык A) на целевой язык (язык B) с помощью расширенных методов обработки языка. Улучшает качество перевода и обновляет текст с учетом гендерных аспектов с помощью переформулирования с использованием LLM.

  • Автоматическое преобразование — создание голосовой связи на другом языке.

    Использует технологию преобразования текста в речь на базе искусственного интеллекта для автоматического создания голосов, звучащих по-человечески, на целевом языке. Эти голоса точно синхронизированы с видео, обеспечивая безупречный интерфейс перевода. Это включает использование стандартных голосов для получения высококачественного результата и предоставление возможности использования личного голоса.

  • Участие человека в процессе редактирования контента.

    Позволяет человеку вмешаться для просмотра и редактирования переведенного содержания, обеспечивая точность и культурную уместность перед окончательной обработкой дублированного видео.

  • Создание субтитров.

    Предоставляет полностью дублированное видео с переведенным диалогом, синхронизированными субтитрами и сгенерированными голосами, готовое для скачивания и распространения на различных платформах. Можно также задать длину субтитров на каждом экране для оптимального отображения.

Принцип работы

На этой схеме представлен общий обзор рабочего процесса.

Схема рабочего процесса API перевода видео.

  1. Вы отправляете видеофайл, который требуется преобразовать в Хранилище BLOB-объектов Azure.
  2. Вы создаете перевод, указав URL-адрес видеофайла. Включите другие параметры, такие как исходные и целевые языки, тип голоса и необходимость записи субтитров в видео.

    Примечание.

    Создание перевода не инициирует процесс перевода.

  3. Вы можете начать перевод видео, создав итерацию. Итерация — это конкретный экземпляр процесса перевода. Вы можете создать несколько итераций для одного перевода, что позволяет экспериментировать с разными настройками или параметрами.
  4. После первой итерации можно использовать файл субтитров в последующих итерациях. Отправьте собственный файл субтитров или внесите изменения в автоматически созданный файл субтитров и отправьте измененный файл субтитров.
  5. Периодически получать статус перевода и итерации. Состояние указывает, выполняется ли перевод, завершен или не выполнен.
  6. После завершения перевода можно скачать переведенное видео и субтитры. Переведенное видео будет иметь исходную речь, замененную переведенной речью, и субтитры будут синхронизированы с переведенной речью.
  7. Вы также можете удалить перевод и итерацию, если они больше не нужны. При удалении перевода будут удалены все связанные итерации и данные.

Хранение данных

Данные перевода, включая видео и связанные итерации, имеют определенный период хранения, который зависит от метода доступа:

REST API

Начиная с API версии 2026-03-01, каждый перевод включает expiresDateTime свойство, указывающее, когда срок действия данных истекает.

  • API версии 2026-03-01 или более поздней версии: данные перевода хранятся в течение 31 дней с момента последнего действия.
  • API версии 2025-05-20 или более ранних версий: данные перевода хранятся в течение 300 дней с момента последнего действия.

После истечения срока хранения перевод и все связанные данные автоматически удаляются. Чтобы продлить срок хранения, создайте новую итерацию для перевода.

на портале Microsoft Foundry и на портале Speech Studio

Проекты, созданные с помощью портала Microsoft Foundry или портала Speech Studio, следуют другой политике хранения:

  • Дата действия: автоматическое удаление просроченных задач и проектов начинается 1 августа 2026 года.
  • Срок хранения: проекты автоматически удаляются после 360 дней бездействия (никаких изменений или обновлений проекта или ее задач).
  • Предварительное уведомление: для проектов, запланированных на удаление в течение следующих трех месяцев, на портале появится уведомление за три месяца до даты удаления. Это дает вам время принять меры, если вы хотите сохранить проект.
  • Расширение хранения. Чтобы предотвратить удаление, внесите любые изменения в проект или связанные с ней задачи. Это сбрасывает период хранения 360 дней с даты последнего действия.

Подсказка

Регулярно просматривайте проекты и обновляйте их по мере необходимости для поддержания активных проектов. Если вам больше не нужен проект, его можно удалить вручную, чтобы освободить ресурсы немедленно.

Поддерживаемые регионы и языки

Для самой актуальной информации о региональной доступности видеоперевода см. таблицу регионов распознавания речи Azure.

Мы поддерживаем видеотрансляции между различными языками, что позволяет адаптировать содержимое к определенным языковым предпочтениям. Языки, поддерживаемые для перевода видео, см. на поддерживаемых исходных и целевых языках.

Ценообразование

Сведения о ценах на видеотрансляции см. в разделе цены на службу "Речь". Цены на видеотрансляции отображаются только для регионов служб, где доступна функция. См. таблицу регионов службы "Речь " для текущей региональной доступности.

  • Чтобы приступить к работе с видеопереводом, узнайте, как использовать видеоперевод.