Поделиться через


Совместное использование кода между записными книжками Databricks

В этой статье описывается, как использовать файлы для модульизации кода, включая создание и импорт файлов Python.

Databricks также поддерживает задания с несколькими задачами, которые позволяют объединять записные книжки в рабочие процессы со сложными зависимостями. Дополнительные сведения см. в разделе Оркестрация с помощью заданий Databricks.

Организуйте ваш код в модули с помощью файлов

С помощью Databricks Runtime 11.3 LTS и более поздних версий вы можете создавать и управлять файлами исходного кода в рабочей области Azure Databricks, а затем импортировать эти файлы в записные книжки по мере необходимости. Вы также можете использовать репозиторий Databricks для синхронизации файлов с репозиторием Git. Дополнительные сведения см. в статьях "Работа с модулями Python и R" и "Интеграция Git для папок Git в Databricks".

Создание файла Python

Чтобы создать файл:

  1. На левой боковой панели щелкните "Рабочая область".
  2. Нажмите кнопку "Создать > файл". Файл откроется в окне редактора и изменения сохраняются автоматически.
  3. Введите имя файла, заканчивающегося .py.

Импорт файла в записную книжку

Файл можно импортировать в записную книжку с помощью стандартных команд импорта Python:

Предположим, у вас есть следующий файл:

файл, определяющий функции

Этот файл можно импортировать в записную книжку и вызвать функции, определенные в файле:

импорт файла в записную книжку

Импорт файла из другой папки в записную книжку

Если вспомогательный файл находится в другой папке, необходимо использовать полный путь к файлу. Чтобы скопировать полный путь, перейдите к файлу в рабочей области и в меню кебаб нажмите кнопку "Копировать URL-адрес или путь > полный".

Файл можно импортировать из другой папки в записную книжку следующим образом:

импорт файла в записную книжку

Запуск файла

Файл можно запустить из редактора. Это полезно для тестирования. Чтобы запустить файл, поместите курсор в область кода и нажмите клавиши SHIFT+ВВОД , чтобы запустить ячейку, или выделить код в ячейке и нажать клавиши SHIFT+CTRL+ВВОД , чтобы запустить только выбранный код.

Удаление файла

Для получения информации о доступе к меню рабочей области и удалении файлов или других элементов в рабочей области, см. Папки и Операции с объектами рабочей области.

Переименование файла

Чтобы изменить название открытого файла, щелкните по заголовку и редактируйте его на месте или выберите Файл > Переименовать.

Управление доступом к файлу

Если у вашей учетной записи Azure Databricks есть план Premium, вы можете использовать управление доступом к рабочей области для управления доступом к файлу.