Прочитать на английском

Поделиться через


Использование scikit-learn в Azure Databricks

На этой странице приведены примеры использования scikit-learn пакета для обучения моделей машинного обучения в Azure Databricks. scikit-learn является одной из самых популярных библиотек Python для машинного обучения с одним узлом и включен в Databricks Runtime и Databricks Runtime ML. См. заметки о выпуске Databricks Runtime, чтобы узнать версию библиотеки scikit-learn, включённую в среду выполнения вашего кластера.

Эти записные книжки можно импортировать и запустить в рабочей области Azure Databricks.

Дополнительные примеры записных книжек для быстрого начала работы в Azure Databricks см. в руководствах по искусственному интеллекту и машинному обучению.

Базовый пример использования scikit-learn

В этой записной книжке представлен краткий обзор обучения моделей машинного обучения на Azure Databricks. Он использует scikit-learn пакет для обучения простой модели классификации. Он также иллюстрирует использование MLflow для отслеживания процесса разработки модели и Optuna для автоматизации настройки гиперпараметров.

Если рабочая область настроена для работы с Unity Catalog, используйте эту версию записной книжки.

Нотбук классификации scikit-learn (каталог Unity)

Получите ноутбук

Если в вашей рабочей области не активирован Unity Catalog, используйте эту версию блокнота.

Записная книжка классификации scikit-learn

Получите ноутбук

Полный пример использования scikit-learn в Azure Databricks

Эта записная книжка использует scikit-learn для иллюстрации полного комплексного примера загрузки данных, обучения модели, настройки распределенного гиперпараметра и вывода модели. Он также иллюстрирует управление жизненным циклом модели с помощью реестра моделей MLflow для регистрации и регистрации модели.

Если рабочая область настроена для работы с Unity Catalog, используйте эту версию записной книжки.

Используйте scikit-learn с интеграцией MLflow в Databricks (Unity Catalog)

Получите ноутбук

Если в вашей рабочей области не активирован Unity Catalog, используйте эту версию блокнота.

Использование scikit-learn с интеграцией MLflow в Databricks

Получите ноутбук