таблицы Azure Databricks

Azure Databricks поддерживает несколько типов таблиц и форматов хранилища в соответствии с различными потребностями управления данными. Чтобы получить представление о типах таблиц, форматах хранения и интеграции с Unity Catalog, см. раздел Концепции таблиц Azure Databricks.

Типы таблиц

Изучите различные типы таблиц и их возможности для различных сценариев управления данными.

Тип таблицы Description
Таблицы, управляемые Unity Catalog в Azure Databricks для Delta Lake и Apache Iceberg Azure Databricks управляет метаданными и файлами данных для новых таблиц, требующих оптимизированной производительности.
Временные таблицы Управляемые сессией таблицы в Unity Catalog для промежуточных данных. Только хранилища SQL.
Работа с внешними таблицами Данные, хранящиеся во внешних системах. Каталог Unity управляет только метаданными.
Работа с внешними таблицами Доступ к данным только для чтения во внешних системах, подключенных через Lakehouse Federation.

Форматы хранилища

Работа с открытыми форматами таблиц, поддерживающими расширенные возможности управления данными.

Формат Description
Delta Lake Формат хранения по умолчанию с транзакциями ACID, возможностью возврата во времени и обеспечением соблюдения схемы для управляемых и внешних таблиц.
Apache Iceberg Открытый формат таблицы для интеграции с экосистемой Айсберга, поддерживающий расширенное управление метаданными.

Управление таблицами

Настройте и оптимизируйте поведение таблицы, структуру и производительность.

Функция Description
Ограничения таблиц Определите и примените правила качества данных с ограничениями проверки, а не ограничениями NULL.
Принудительное применение схемы Управление тем, как Azure Databricks обрабатывает изменения схемы и принудительное применение типов данных во время записи.
Секционирование таблиц Организуйте данные по ключам разделов для повышения производительности запросов и управления данными.
Мониторинг размера таблицы Мониторьте и анализируйте использование и тенденции роста хранилища таблиц.
Преобразование внешнего в управляемое Перенос внешних таблиц в управляемые таблицы для повышения производительности и управления.
Обнаружение внешних секций Автоматическое обнаружение и регистрация секций во внешних таблицах, хранящихся в облачном хранилище.