Поделиться через


обучение пользовательской модели;

Модель предоставляет переводы для определенной языковой пары. Модель создается в результате успешного обучения. Для обучения пользовательской модели требуются три взаимоисключающих типа документов: обучение, настройка и тестирование. Если при очереди обучения предоставляются только обучающие данные, настраиваемый переводчик автоматически собирает данные настройки и тестирования. Он использует случайное подмножество предложений из обучающих документов и исключает эти предложения из самих обучающих данных. Для обучения полной модели требуется не менее 10 000 параллельных предложений с обучающими данными.

Создание модели

  1. Выберите колонку Обучение модели.

  2. Введите имя модели.

  3. Оставьте выбранным флажок по умолчанию Полное обучение или выберите Обучение только для словаря.

    Примечание.

    В режиме полного обучения отображаются все отправленные типы документов. В режиме обучения только для словаря отображаются только документы словаря.

  4. В разделе Выбор документов выберите документы, которые нужно использовать для обучения модели (например, sample-English-German), а также просмотрите затраты на обучение, связанные с выбранным количеством предложений.

  5. Щелкните Обучить.

  6. Для подтверждения щелкните Обучить.

    Примечание.

    В уведомлениях отображается ход обучения модели, например состояние Отправка данных. Обучение модели занимает несколько часов в зависимости от количества выбранных предложений.

    Снимок экрана: колонка

Когда следует выбирать обучение только для словаря

Для получения лучших результатов рекомендуется позволить системе обучаться с помощью данных для обучения. Однако если у вас недостаточно параллельных предложений, чтобы удовлетворить минимальные требования в 10 000 предложений, либо если предложения и составные существительные должны предъявляться без изменений, используйте обучение только для словаря. Модель обычно завершает обучение быстрее, чем с полным обучением. Полученные модели используют базовые модели для перевода вместе с добавленными словарями. Вы не видите BLEU оценки или не получаете тестовый отчет.

Примечание.

Пользовательский переводчик не выравнивает предложения в файлах словарей. Поэтому важно, чтобы количество и расположения фраз и (или) предложений в исходном и целевом документах словаря совпадали. В противном случае отправка документа завершится ошибкой.

Сведения о модели

  1. После успешного обучения модели выберите колонку Сведения о модели.

  2. Выберите Имя модели, чтобы просмотреть дату и время обучения, общую продолжительность обучения, количество предложений, использованных для обучения, настройки, тестирования, словаря, а также сведений о том, создала ли система наборы для тестирования и настройки. Вы используете Category ID для выполнения запросов на перевод.

  3. Оцените оценку моделиBLEU. Просмотрите набор тестов: оценка BLEU — это пользовательский показатель модели, а базовый BLEU — это предварительно обученная базовая модель, используемая для настройки. Чем выше оценка BLEU, тем лучше качество перевода у пользовательской модели.

    Снимок экрана: поля сведений о модели.

Дублирование модели

  1. Выберите колонку Сведения о модели.

  2. Наведите указатель мыши на имя модели и отметьте кнопку выбора.

  3. Щелкните Дублировать.

  4. Заполните поле Имя новой модели.

  5. Оставить обучение немедленно проверять, не выбраны ли дополнительные данные или отправлены, в противном случае установите флажок "Сохранить как черновик"

  6. Выберите Сохранить

    Примечание.

    Если модель сохраняется как Draft, в Сведения о модели заносится имя модели в состоянии Draft.

    Чтобы добавить дополнительные документы, выберите имя модели и выполните действия, описанные в разделе "Создание модели ".

    Снимок экрана: колонка повторяющихся моделей.

Следующие шаги