обучение пользовательской модели;
Модель предоставляет переводы для определенной языковой пары. Модель создается в результате успешного обучения. Для обучения пользовательской модели требуются три взаимоисключающих типа документов: обучение, настройка и тестирование. Если при очереди обучения предоставляются только обучающие данные, настраиваемый переводчик автоматически собирает данные настройки и тестирования. Он использует случайное подмножество предложений из обучающих документов и исключает эти предложения из самих обучающих данных. Для обучения полной модели требуется не менее 10 000 параллельных предложений с обучающими данными.
Создание модели
Выберите колонку Обучение модели.
Введите имя модели.
Оставьте выбранным флажок по умолчанию Полное обучение или выберите Обучение только для словаря.
Примечание.
В режиме полного обучения отображаются все отправленные типы документов. В режиме обучения только для словаря отображаются только документы словаря.
В разделе Выбор документов выберите документы, которые нужно использовать для обучения модели (например,
sample-English-German
), а также просмотрите затраты на обучение, связанные с выбранным количеством предложений.Щелкните Обучить.
Для подтверждения щелкните Обучить.
Примечание.
В уведомлениях отображается ход обучения модели, например состояние Отправка данных. Обучение модели занимает несколько часов в зависимости от количества выбранных предложений.
Когда следует выбирать обучение только для словаря
Для получения лучших результатов рекомендуется позволить системе обучаться с помощью данных для обучения. Однако если у вас недостаточно параллельных предложений, чтобы удовлетворить минимальные требования в 10 000 предложений, либо если предложения и составные существительные должны предъявляться без изменений, используйте обучение только для словаря. Модель обычно завершает обучение быстрее, чем с полным обучением. Полученные модели используют базовые модели для перевода вместе с добавленными словарями. Вы не видите BLEU
оценки или не получаете тестовый отчет.
Примечание.
Пользовательский переводчик не выравнивает предложения в файлах словарей. Поэтому важно, чтобы количество и расположения фраз и (или) предложений в исходном и целевом документах словаря совпадали. В противном случае отправка документа завершится ошибкой.
Сведения о модели
После успешного обучения модели выберите колонку Сведения о модели.
Выберите Имя модели, чтобы просмотреть дату и время обучения, общую продолжительность обучения, количество предложений, использованных для обучения, настройки, тестирования, словаря, а также сведений о том, создала ли система наборы для тестирования и настройки. Вы используете
Category ID
для выполнения запросов на перевод.Оцените оценку модели
BLEU
. Просмотрите набор тестов: оценка BLEU — это пользовательский показатель модели, а базовый BLEU — это предварительно обученная базовая модель, используемая для настройки. Чем выше оценка BLEU, тем лучше качество перевода у пользовательской модели.
Дублирование модели
Выберите колонку Сведения о модели.
Наведите указатель мыши на имя модели и отметьте кнопку выбора.
Щелкните Дублировать.
Заполните поле Имя новой модели.
Оставить обучение немедленно проверять, не выбраны ли дополнительные данные или отправлены, в противном случае установите флажок "Сохранить как черновик"
Выберите Сохранить
Примечание.
Если модель сохраняется как
Draft
, в Сведения о модели заносится имя модели в состоянииDraft
.Чтобы добавить дополнительные документы, выберите имя модели и выполните действия, описанные в разделе "Создание модели ".
Следующие шаги
- Узнайте, как тестировать и оценивать качество модели.
- Узнайте, как опубликовать модель.
- Узнайте, как выполнять перевод с помощью пользовательских моделей.