Поделиться через


Обучение моделей с помощью Машинного обучения Azure (версия 1)

ПРИМЕНЯЕТСЯ К:Пакет SDK машинного обучения Azure версии 1 для Python

Important

В этой статье содержатся сведения об использовании пакета SDK машинного обучения Azure версии 1. Пакет SDK версии 1 устарел с 31 марта 2025 г. Поддержка будет завершена 30 июня 2026 г. Вы можете установить и использовать пакет SDK версии 1 до этой даты. Существующие рабочие процессы, использующие пакет SDK версии 1, будут продолжать работать после даты окончания поддержки. Однако они могут быть подвержены рискам безопасности или критическим изменениям в случае изменений архитектуры в продукте.

Рекомендуется перейти на пакет SDK версии 2 до 30 июня 2026 г. Дополнительные сведения о пакете SDK версии 2 см. в статье "Что такое ИНТЕРФЕЙС командной строки Машинного обучения Azure" и пакет SDK для Python версии 2 исправочник по пакету SDK версии 2.

Машинное обучение Azure предлагает несколько способов обучения моделей, включая решения, в которых код является приоритетом с помощью пакета SDK и варианты с низким уровнем кодирования, такие как автоматизированное машинное обучение и визуальный конструктор. Используйте следующий список, чтобы определить, какой метод обучения соответствует вашим потребностям:

  • пакет SDK Машинное обучение Azure для Python: пакет SDK для Python предоставляет несколько способов обучения моделей с разными возможностями.

    Метод обучения Description
    Настройка запуска Распространенный способ обучения моделей — использовать скрипт обучения и конфигурацию задания. Конфигурация задания определяет среду обучения, включая скрипт, целевой объект вычислений и среду машинного обучения Azure. Вы можете запустить задание обучения, указав эти сведения.
    Автоматизированное машинное обучение Автоматизированное машинное обучение позволяет обучать модели без глубокого анализа данных или опыта программирования. Для опытных пользователей это позволяет сэкономить время, автоматив выбор алгоритма и настройку гиперпараметров. Конфигурация задания не требуется при использовании автоматизированного машинного обучения.
    Конвейер машинного обучения Конвейеры не являются отдельным методом обучения, а способом определения рабочих процессов с помощью модульных, многократно используемых шагов , которые могут включать обучение. Конвейеры поддерживают как автоматизированное машинное обучение, так и конфигурацию запуска. Используйте конвейер, когда требуется:
    * Планирование неконтролируемых процессов, таких как длительные задания обучения или подготовка данных.
    * Координирует несколько шагов между различными вычислительными ресурсами и расположениями хранилища.
    * Создайте повторно используемый шаблон для таких сценариев, как переобучение или пакетная оценка.
    * Отслеживаете источники данных, входные и выходные данные и управляете версиями для рабочего процесса.
    * Включите разные команды, чтобы они могли работать с конкретными шагами независимо и объедините их в потоке.
  • Конструктор: конструктор машинного обучения Azure — это простая точка входа для создания доказательств концепций или для пользователей с ограниченным опытом написания кода. Обучение моделей с помощью веб-интерфейса с функцией перетаскивания. Вы можете включить код Python или обучать модели без написания кода.

  • Azure CLI. Интерфейс командной строки машинного обучения предлагает команды для распространенных задач машинного обучения Azure и часто используется для сценариев и автоматизации. Например, после создания скрипта обучения или конвейера вы можете использовать CLI для запуска задания обучения по графику или при обновлении данных обучения. Интерфейс командной строки может отправлять задания с помощью конфигураций выполнения или конвейеров.

Каждый метод обучения может использовать различные типы вычислительных ресурсов, называемые целевыми объектами вычислений. Целевой объект вычислений может быть локальным компьютером или облачным ресурсом, например вычислением Машинного обучения Azure, Azure HDInsight или удаленной виртуальной машиной.

Пакет SDK для Python

Пакет SDK машинного обучения Azure для Python позволяет создавать и запускать рабочие процессы машинного обучения. Вы можете взаимодействовать со службой из интерактивного сеанса Python, Jupyter Notebook, Visual Studio Code или предпочитаемой интегрированной среды разработки.

Настройка запуска

Обычное задание обучения в Машинном обучении Azure определяется с помощью ScriptRunConfig. Конфигурация запуска скрипта вместе с скриптами обучения используется для обучения модели в целевом объекте вычислений.

Вы можете начать с конфигурации запуска для локального компьютера и переключиться на облачный целевой объект вычислений по мере необходимости. Чтобы изменить целевой объект вычислений, обновите конфигурацию запуска. Каждый запуск регистрирует сведения о задании обучения, включая входные данные, выходные данные и журналы.

Автоматизированное машинное обучение

Задайте итерации, настройки гиперпараметров, создание признаков и другие параметры. Во время обучения Машинное обучение Azure проверяет различные алгоритмы и параметры параллельно. Обучение останавливается, если оно соответствует заданным условиям выхода.

Tip

Кроме того, вы можете использовать автоматизированное машинное обучение в студии машинного обучения Azure, а также пакет SDK для Python.

Конвейер машинного обучения

Конвейеры машинного обучения могут использовать описанные выше методы обучения. Конвейеры сосредоточены на создании рабочих процессов, поэтому они охватывают больше, чем просто обучение модели. В конвейере можно обучать модель с помощью автоматизированного машинного обучения или конфигураций запуска.

Общие сведения о том, что происходит при отправке задания обучения

Жизненный цикл обучения Azure включает:

  1. Архивирование файлов в папке проекта, за исключением тех, которые указаны в .amlignore или .gitignore.
  2. масштабирование вычислительного кластера;
  3. Создание или скачивание образа Docker на вычислительный узел
    1. Система вычисляет хэш:
    2. Система использует этот хэш для поиска реестра контейнеров Azure (ACR) рабочей области.
    3. Если он не найден, он проверяет глобальный ACR
    4. Если система по-прежнему не найдена, система создает новый образ (который кэшируется и зарегистрирован в ACR рабочей области)
  4. Загрузка упакованного файла проекта во временное хранилище в вычислительном узле.
  5. Распаковка файла проекта.
  6. Вычислительный узел выполняет python <entry script> <arguments>
  7. Сохранение журналов, файлов моделей и других файлов, записанных в ./outputs в учетной записи хранения, связанной с рабочей областью.
  8. Уменьшение масштаба вычислений, включая удаление временного хранилища.

Если вы обучаете на локальном компьютере ("настройка в качестве локального запуска"), Docker не требуется. Вы можете использовать Docker локально, если вы предпочитаете (см. пример настройки конвейера машинного обучения ).

Конструктор Машинного обучения Azure

Конструктор позволяет обучать модели с помощью интерфейса перетаскивания в веб-браузере.

Azure CLI

Интерфейс командной строки для машинного обучения является расширением для Azure CLI. Она предоставляет кроссплатформенные команды для работы с Машинным обучением Azure. Как правило, интерфейс командной строки используется для автоматизации задач, таких как обучение модели машинного обучения.

Дальнейшие шаги

Узнайте, как настроить обучающий запуск.