Настройка бессерверного конвейера

2025-06-11

В этой статье описываются конфигурации бессерверных декларативных конвейеров Lakeflow.

Databricks рекомендует разрабатывать новые конвейеры с использованием бессерверной инфраструктуры. Для некоторых рабочих нагрузок может потребоваться настройка классических вычислений или работа с устаревшим хранилищем метаданных Hive. См. статью "Настройка вычислений для декларативных конвейеров Lakeflow" и использование декларативных конвейеров Lakeflow с устаревшим хранилищем метаданных Hive.

Примечание.

Бессерверные конвейеры всегда используют каталог Unity. Используйте каталог Unity с декларативными конвейерами Lakeflow.
Ограничения бессерверных вычислений см. в Ограничения бессерверных вычислений.
Невозможно вручную добавить параметры вычислений clusters в объект в конфигурацию JSON для бессерверного конвейера. Попытка сделать это приведет к ошибке.

Если вам нужно использовать подключение Azure Private Link с бессерверными потоками данных Lakeflow, обратитесь к представителю Databricks.

Требования

В рабочей области должен быть включен каталог Unity для использования бессерверных конвейеров.

Рабочая область должна находиться в бессерверном регионе.

Другие рекомендации по настройке

Следующие параметры конфигурации также доступны для бессерверных конвейеров:

При запуске конвейеров в продакшене можно выбрать непрерывный режим конвейера. См. раздел "Триггерный и непрерывный режимы конвейера".
Добавьте уведомления для электронных писем на основе условий успешного выполнения или сбоя. См. добавьте уведомления по электронной почте для событий конвейера.
Используйте поле конфигурации, чтобы задать пары "ключ-значение" для конвейера. Эти конфигурации служат двумя целями:
- Задайте произвольные параметры, на которые можно ссылаться в исходном коде. См. раздел "Использование параметров с декларативными конвейерами Lakeflow".
- Настройте параметры конвейера и конфигурации Spark. См. справочник по свойствам декларативных конвейеров Lakeflow.
Используйте канал Preview для тестирования вашего конвейера в соответствии с ожидаемыми изменениями в среде выполнения декларативных конвейеров Lakeflow и испытания новых функций.

Бессерверная политика бюджета

Это важно

Эта функция доступна в общедоступной предварительной версии.

Бессерверные бюджетные политики позволяют организации применять пользовательские теги к бессерверному использованию для более детализированного выставления счетов. После выбора флажка Бессерверный появится параметр политики бюджета, где можно выбрать политику, которую вы хотите применить к пайплайну. Теги наследуются от бессерверной политики бюджета и могут изменяться только администраторами рабочей области.

Примечание.

После того как вам назначат политику бюджета для безсерверных решений, ваши существующие конвейеры не будут автоматически отмечены этой политикой. Чтобы привязать политику к существующим конвейерам, вы должны обновить их вручную.

Дополнительные сведения о бессерверных политиках бюджета см. в разделе "Использование атрибутов с бессерверными политиками бюджета".

Выбор режима производительности

Для триггерных конвейеров можно выбрать бессерверный режим производительности вычислений с помощью оптимизированного для производительности параметра в планировщике конвейера. Если этот параметр отключен, конвейер использует стандартный режим производительности. Стандартный режим производительности предназначен для снижения затрат на рабочие нагрузки, в которых допустима небольшая задержка запуска. Бессерверные рабочие нагрузки, использующие стандартный режим производительности, обычно начинаются в течение четырех–шести минут после активации в зависимости от доступности вычислений и оптимизированного планирования.

При включении оптимизации производительности конвейер оптимизирован для производительности, что приводит к более быстрому запуску и выполнению рабочих нагрузок с учетом времени.

Примечание.

Стандартный режим производительности поддерживается только для активированного режима конвейера. Непрерывное выполнение не поддерживается.

Функции бессерверного конвейера

Помимо упрощения конфигурации бессерверные конвейеры имеют следующие функции:

добавочное обновление для материализованных представлений: обновления для материализованных представлений обновляются постепенно, когда это возможно. Инкрементное обновление имеет те же результаты, что и полный пересчёт. Обновление использует полную перезагрузку, если невозможно поэтапное вычисление результатов. См. инкрементальное обновление материализованных представлений.

Конвейерная обработка потоков: для улучшения использования, пропускной способности и снижения задержки при обработке нагрузок потоковой передачи данных, таких как прием данных, микропакеты конвейеризуются. Другими словами, вместо последовательного запуска микробаток, таких как стандартная структурированная потоковая передача Spark, бессерверные декларативные конвейеры Lakeflow одновременно выполняют микробаты, повышая использование вычислительных ресурсов. Потоковая конвейерная настройка включена по умолчанию в бессерверных декларативных конвейерах Lakeflow.
Вертикальное автоматическое масштабирование: бессерверные декларативные конвейеры Lakeflow дополняют горизонтальное автоматическое масштабирование, предоставляемое Databricks, за счет автоматического выделения наиболее экономически эффективных типов экземпляров, которые могут запускать ваш конвейер без сбоев из-за нехватки памяти. См. раздел "Что такое автомасштабирование по вертикали"?

Преобразование существующего конвейера в бессерверный

Существующие конвейеры, настроенные с помощью каталога Unity, можно преобразовать в бессерверные конвейеры. Выполните следующие действия.

Щелкните "Конвейеры" на боковой панели.
Щелкните имя требуемого конвейера в списке.
Щелкните Параметры.
Установите флажок рядом с бессерверным.
Нажмите кнопку "Сохранить" и " Начать".

Это важно

При включении режима без сервера все настройки вычислений, которые были сконфигурированы для конвейера, удаляются. При переключении конвейера обратно на несерверные обновления необходимо перенастроить требуемые параметры вычислений в конфигурацию конвейера.

Как узнать использование DBU в бессерверном конвейере?

Вы можете найти использование DBU для бессерверных декларативных конвейеров Lakeflow, запросив таблицу оплачиваемого использования, которая является частью системных таблиц Azure Databricks. См. раздел "Что такое потребление DBU бессерверного конвейера?".

Поделиться через

Настройка бессерверного конвейера

Требования

Рекомендуемая конфигурация бессерверных конвейеров

Другие рекомендации по настройке

Бессерверная политика бюджета

Выбор режима производительности

Функции бессерверного конвейера

Преобразование существующего конвейера в бессерверный

Как узнать использование DBU в бессерверном конвейере?

Обратная связь

Дополнительные ресурсы