Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Azure Databricks поддерживает несколько типов таблиц и форматов хранилища в соответствии с различными потребностями управления данными. Чтобы получить представление о типах таблиц, форматах хранения и интеграции с Unity Catalog, см. раздел Концепции таблиц Azure Databricks.
Типы таблиц
Изучите различные типы таблиц и их возможности для различных сценариев управления данными.
| Тип таблицы | Description |
|---|---|
| Таблицы, управляемые Unity Catalog в Azure Databricks для Delta Lake и Apache Iceberg | Azure Databricks управляет метаданными и файлами данных для новых таблиц, требующих оптимизированной производительности. |
| Временные таблицы | Управляемые сессией таблицы в Unity Catalog для промежуточных данных. Только хранилища SQL. |
| Работа с внешними таблицами | Данные, хранящиеся во внешних системах. Каталог Unity управляет только метаданными. |
| Работа с внешними таблицами | Доступ к данным только для чтения во внешних системах, подключенных через Lakehouse Federation. |
Форматы хранилища
Работа с открытыми форматами таблиц, поддерживающими расширенные возможности управления данными.
| Формат | Description |
|---|---|
| Delta Lake | Формат хранения по умолчанию с транзакциями ACID, возможностью возврата во времени и обеспечением соблюдения схемы для управляемых и внешних таблиц. |
| Apache Iceberg | Открытый формат таблицы для интеграции с экосистемой Айсберга, поддерживающий расширенное управление метаданными. |
Управление таблицами
Настройте и оптимизируйте поведение таблицы, структуру и производительность.
| Функция | Description |
|---|---|
| Ограничения таблиц | Определите и примените правила качества данных с ограничениями проверки, а не ограничениями NULL. |
| Принудительное применение схемы | Управление тем, как Azure Databricks обрабатывает изменения схемы и принудительное применение типов данных во время записи. |
| Секционирование таблиц | Организуйте данные по ключам разделов для повышения производительности запросов и управления данными. |
| Мониторинг размера таблицы | Мониторьте и анализируйте использование и тенденции роста хранилища таблиц. |
| Преобразование внешнего в управляемое | Перенос внешних таблиц в управляемые таблицы для повышения производительности и управления. |
| Обнаружение внешних секций | Автоматическое обнаружение и регистрация секций во внешних таблицах, хранящихся в облачном хранилище. |