Поделиться через


Использование меток машинного обучения Azure в Language Studio

Данные маркировки являются важной частью подготовки набора данных. Используя интерфейс маркировки в Машинное обучение Azure, вы можете упростить совместную работу, повысить гибкость и возможность аутсорсинга задач по маркировке внешним поставщикам меток из Azure Market Place. Вы можете использовать разметку в Azure Machine Learning для:

Предварительные требования

Прежде чем подключить проект разметки к Azure Machine Learning, для этого вам потребуется:

  • Успешно создан проект Language Studio с настроенной учетной записью Blob-хранилища Azure.
  • Текстовые данные, загруженные в вашу учетную запись хранения.
  • По крайней мере:
    • Одна метка сущности для настраиваемого распознавания именованных сущностей или
    • Две метки классов для проектов пользовательской классификации текста.
  • Рабочая область Azure Machine Learning, подключенная к той же учетной записи хранилища BLOB-объектов Azure, которую использует ваша учетная запись Language Studio.

Ограничения

  • Подключение проекта маркировки к Azure Machine Learning — это соединение "один к одному". Если вы отключите проект, вы не сможете подключить проект обратно к тому же проекту Машинное обучение Azure
  • Вы не можете одновременно размечать в Language Studio и Azure Machine Learning. Опыт работы с маркировкой доступен в каждой студии по очереди.
  • Тестовые и обучающие файлы в интерфейсе маркировки, от которого вы переключаетесь, будут игнорироваться при обучении вашей модели.
  • Импортировать в Language Studio можно только файлы формата JSONL, принадлежащие Azure Machine Learning.
  • Проекты с включенной многоязычной опцией не могут быть подключены к сервису Azure Machine Learning, и не все языки поддерживаются.
  • Рабочая область Машинного обучения Azure, к которой вы подключаетесь, должна быть назначена той же учетной записи Azure Storage, к которой подключена Language Studio. Убедитесь, что у рабочей области Azure Machine Learning есть разрешение для чтения данных объектов блоб-хранилища в учетной записи хранилища. Рабочая область должна быть связана с учетной записью хранения на этапе создания на портале Azure.
  • Переключение между двумя интерфейсами маркировки не является мгновенным. Для успешного выполнения операции может потребоваться время.

Импортируйте метки Azure Machine Learning в Language Studio

Language Studio поддерживает формат файлов JSONL, используемый Azure Machine Learning. Если вы размечали данные с помощью Azure Machine Learning, вы можете импортировать актуальные метки в новый пользовательский проект, чтобы использовать возможности обеих платформ.

  1. Сначала создайте проект для пользовательской классификации текста или распознавания именованных сущностей.

    1. На появившемся экране создания проекта следуйте инструкциям по подключению учетной записи хранения и введите основные сведения о проекте. Убедитесь, что ресурс Azure, который вы используете, не подключен к другой учетной записи хранения.

    2. В разделе "Выбор контейнера" выберите параметр, указывающий, что у вас уже есть правильно отформатированный файл. Затем выберите ваш самый последний файл меток Azure Machine Learning.

      Снимок экрана: выбор файла меток в Language Studio.

Подключитесь к машинному обучению Azure

Прежде чем подключиться к Машинное обучение Azure, вам потребуется учетная запись Машинное обучение Azure с тарифным планом, который может соответствовать потребностям вычислений проекта. Ознакомьтесь с разделом предварительных требований, чтобы убедиться, что вы успешно выполнили все требования, чтобы начать подключение проекта Language Studio к Машинное обучение Azure.

  1. Используйте портал Azure, чтобы перейти к учетной записи Azure Blob Storage, подключенной к вашему языковому ресурсу.

  2. Убедитесь, что роль Участник данных хранилища BLOB назначена вашей рабочей области AML в рамках назначений ролей для вашей учетной записи хранилища BLOB-объектов Azure.

  3. Перейдите к проекту в Language Studio. В меню навигации слева проекта выберите метки данных.

  4. Выберите использовать Машинное обучение Azure для маркировки либо в описании маркировки данных, либо на панели действий.

    Снимок экрана: расположение ссылки Машинное обучение Azure.

  5. Выберите Подключиться к машинному обучению Azure, чтобы запустить процесс подключения.

    Снимок экрана: кнопка подключения Машинное обучение Azure в Language Studio.

  6. В появившемся окне следуйте инструкциям. Выберите рабочую область Машинное обучение Azure, созданную ранее в той же подписке Azure. Введите имя для нового проекта Azure Machine Learning, который будет создан с целью включения разметки в Azure Machine Learning.

    Совет

    Перед продолжением убедитесь, что ваша рабочая область связана с той же учетной записью Azure Blob Storage и языковым ресурсом. Вы можете создать новую рабочую область и привязать ее к учетной записи хранения через портал Azure. Убедитесь, что учетная запись хранения правильно связана с рабочей областью.

  7. (Необязательно) Включите переключатель маркировки поставщика, чтобы использовать компании, занимающиеся маркировкой. Прежде чем выбирать компании по маркировке поставщиков, обратитесь к компаниям по маркировке поставщиков в Azure Marketplace , чтобы завершить контракт с ними. Дополнительные сведения о работе с компаниями-поставщиками см. в статье "Как аутсорсить разметку данных".

    Вы также можете оставить инструкции по маркировке для специалистов по разметке, которые помогут вам в процессе. Эти инструкции помогут им понять задачу, оставив четкие определения меток и в том числе примеры для улучшения результатов.

  8. Проверьте параметры вашего подключения к Azure Machine Learning и внесите изменения, если необходимо.

    Внимание

    Завершение подключения является постоянным. Попытка отключить установленное подключение в любой момент приведет к тому, что ваш проект Language Studio больше никогда не сможет подключиться к тому же проекту Azure Machine Learning.

  9. После инициирования подключения возможность пометить данные в Language Studio будет отключена в течение нескольких минут, чтобы подготовить новое подключение.

Переход на использование Azure Machine Learning для маркировки вместо Language Studio

После установки подключения вы можете в любое время переключиться на Машинное обучение Azure с помощью панели действий в Language Studio.

Снимок экрана, показывающий кнопку для переключения на маркировку с помощью машинного обучения Azure.

При переключении ваша возможность маркировки данных в Language Studio будет отключена, и вы сможете пометить данные в Azure Machine Learning. Вы можете вернуться к маркировке в Language Studio в любое время через Машинное обучение Azure.

Сведения о том, как пометить текст, см. в разделе Azure Machine Learning как пометить. См. Настройку и управление проектом по маркировке текста в Azure Machine Learning для получения сведений об управлении и отслеживании проекта маркировки текста.

Обучите вашу модель, используя метки из Azure Machine Learning

При переходе к использованию маркировки с помощью Azure Machine Learning, можно по-прежнему обучать, оценивать и развертывать вашу модель в Language Studio. Чтобы обучить вашу модель с использованием обновленных меток из Azure Machine Learning:

  1. Выберите Задания на обучение в меню навигации слева от экрана Языковая студия для вашего проекта.

  2. Выберите "Импортировать последние метки из Azure Machine Learning" в разделе "Выбор происхождения меток" на странице обучения. Это синхронизирует метки из Машинного обучения Azure перед запуском учебной задачи.

    Снимок экрана, показывающий селектор для использования меток из Azure Machine Learning.

Переход на маркировку с помощью Language Studio из Azure Machine Learning

После того как вы перейдёте на маркировку с помощью Azure Machine Learning, вы можете в любой момент вернуться к маркировке с использованием проекта Language Studio.

Примечание.

  • Только пользователи с соответствующими ролями в Azure Machine Learning имеют возможность переключать метки.
  • При переключении на использование Language Studio метка в Машинном обучении Azure будет отключена.

Чтобы вернуться к маркировке с помощью Language Studio, выполните следующее:

  1. Перейдите к проекту в Машинное обучение Azure и выберите метки данных в меню навигации слева.

  2. Перейдите на вкладку Language Studio и выберите "Переключиться на Language Studio".

    Снимок экрана: селектор для использования меток из Language Studio.

  3. Процесс займет несколько минут, и возможность размечать данные в Azure Machine Learning будет отключена, пока она не будет возвращена из Language Studio.

Отключение от Azure Machine Learning

Отключение вашего проекта от Azure Machine Learning — это постоянный, необратимый процесс, который нельзя отменить. Вы больше не сможете получить доступ к меткам в Azure Machine Learning, и не сможете снова подключить проект Azure Machine Learning к любому проекту Language Studio в будущем. Чтобы отключиться от службы Azure Machine Learning:

  1. Убедитесь, что все обновленные метки, которые требуется поддерживать, синхронизируются с Azure Machine Learning, переключив процесс аннотирования обратно в Language Studio.
  2. Выберите параметры проекта в меню навигации слева в Language Studio.
  3. Нажмите кнопку "Отключиться от Azure Machine Learning" в разделе "Управление подключениями Azure Machine Learning".

Следующие шаги

Дополнительные сведения о маркировке данных для специальной классификации текста и специального распознавания именованных сущностей.