Поделиться через


REORG TABLE

Область применения:флажок Databricks SQL флажок Databricks Runtime 11.3 LTS и выше

Переорганизуйте таблицу Delta Lake, перезаписав файлы для очистки мягко удаленных данных, таких как столбцы данных, удаленные с помощью ALTER TABLE DROP COLUMN.

Синтаксис

REORG [ TABLE ] table_name { [ WHERE predicate ] APPLY ( PURGE ) |
                             APPLY ( UPGRADE UNIFORM ( ICEBERG_COMPAT_VERSION = version ) } )

Для версий Databricks Runtime до 15.4 TABLE является обязательным ключевым словом.

Примечание.

  • APPLY (PURGE) перезаписывает только файлы, содержащие мягко удаленные данные.
  • APPLY (UPGRADE) может перезаписать все файлы.
  • REORG TABLE является идемпотентным, то есть если он выполняется дважды в одном наборе данных, второй запуск не влияет.
  • После выполнения APPLY (PURGE) данные, помеченные как удаленные, могут по-прежнему существовать в старых файлах. Вы можете запустить VACUUM для физического удаления старых файлов.

Параметры

Примеры

> REORG TABLE events APPLY (PURGE);

> REORG TABLE events WHERE date >= '2022-01-01' APPLY (PURGE);

> REORG TABLE events
    WHERE date >= current_timestamp() - INTERVAL '1' DAY
    APPLY (PURGE);

> REORG TABLE events APPLY (UPGRADE UNIFORM(ICEBERG_COMPAT_VERSION=2));