Использование глоссариев с переводом документов

Глоссарий — это список терминов с определениями, которые создаются для службы перевода документов для использования во время процесса перевода. В настоящее время функция глоссария поддерживает перевод одного к одному источнику на целевой язык. Распространенные варианты использования глоссариев включают:

  • Контекстно-зависимая терминология. Создайте глоссарий, указывающий конкретные значения для уникального контекста.

  • Нет перевода. Например, вы можете ограничить перевод названий торговых марок, используя глоссарий с тем же исходным и целевым текстом.

  • Укажите переводы для неоднозначных слов. Выберите конкретный перевод для полиземантических слов.

Создание, отправка и использование глоссарийного файла

  1. Создайте глоссарий файл. Создайте файл в поддерживаемом формате (предпочтительно разделенные табуляции значения), который содержит все термины и фразы, которые вы хотите использовать в переводе.

    Чтобы проверить, поддерживается ли формат файла, см. статью"Получение поддерживаемых форматов глоссарий".

    Следующий глоссарий английского источника содержит слова, которые могут иметь разные значения в зависимости от контекста. Глоссарий предоставляет ожидаемый перевод для каждого слова в файле, чтобы обеспечить точность.

    Например, когда слово Bank отображается в финансовом документе, оно должно быть переведено, чтобы отразить его финансовое значение. Если слово Bank отображается в географическом документе, оно может ссылаться на берег, чтобы отразить его топологичное значение. Аналогичным образом, слово Crane может ссылаться на птицу или машину.

    Пример глоссария TSV-файла: английский и французский

       Bank     Banque
       Card     Carte
       Crane    Grue
       Office   Office
       Tiger    Tiger
       US       United States
    
  2. Отправьте глоссарий в хранилище Azure. Чтобы выполнить этот шаг, вам потребуется учетная запись Хранилище BLOB-объектов Azure с контейнерамидля хранения и упорядочивания данных BLOB-объектов в учетной записи хранения.

  3. Укажите глоссарий в запросе на перевод. glossary URLВключите и formatversion в запросPOST:

    {
        "inputs": [
            {
                "source": {
                    "sourceUrl": "https://my.blob.core.windows.net/source-en"
                },
                "targets": [
                    {
                         "targetUrl": "https://my.blob.core.windows.net/target-fr",
                        "language": "fr",
                        "glossaries": [
                            {
                                "glossaryUrl": "https://my.blob.core.windows.net/glossaries/en-fr.tsv",
                                "format": "tsv"
                            }
                        ]
    
                    }
                ]
            }
        ]
    }
    

    Note

    В примере используется управляемое удостоверение, назначаемое системой, с назначением роли участника данных BLOB-объектов хранилища для авторизации. Дополнительные сведения см. в разделе"Управляемые удостоверения" для перевода документов.

Конфиденциальность регистра

По умолчанию API Azure Translator чувствителен к регистру, то есть он различает термины в исходном тексте на основе их регистра.

  • Приложение с частичным предложением. Если глоссарий применяется к части предложения, API перевода документов проверяет, соответствует ли термин глоссария в исходном тексте. Если регистр не соответствует, глоссарий не применяется.

  • Полное приложение предложения. Когда глоссарий применяется к полному предложению, служба становится нечувствительной к регистру. Он соответствует термину глоссария, независимо от его регистра, в исходном тексте. Этот атрибут помогает возвращать правильные результаты для вариантов использования с использованием идиом и кавычки.

Обеспечение точности

Глоссарии перевода играют важную роль в обеспечении согласованной и точной терминологии в проектах многоязычной локализации. Применение глоссария во время перевода гарантирует, что определенные термины переводятся в соответствии с определенной исходной и целевой языковой парой. Таким образом, важно тщательно определить глоссарий и регулярно обновлять его для поддержания точности и согласованности. Ниже приведены несколько советов.

  • Явно идентифицируйте исходные и целевые языки для каждого термина глоссария. Также включите все соответствующие требования к локализации.

  • Проводите регулярные проверки глоссария для проверки точности терминов и релевантности. При необходимости постоянно обновляйте записи.

  • Укажите точные и комплексные определения для каждого термина. Обратите особое внимание на технический или специализированный словарь.

Дальнейшие шаги

Ознакомьтесь с инструкцией по переводу документов, чтобы асинхронно переводить целые документы с помощью выбранного языка программирования: