Поделиться через


Клонирование таблицы в Microsoft Fabric

Область применения:✅ хранилище в Microsoft Fabric

Microsoft Fabric предлагает возможность почти мгновенного создания клонов без дублирования данных с минимальными затратами на хранение.

  • Клоны таблиц упрощают процессы разработки и тестирования, создавая копии таблиц в более низких средах.
  • Клоны таблиц обеспечивают последовательные отчеты и дублирование данных без копирования для аналитических рабочих нагрузок, а также для моделирования и тестирования в области машинного обучения.
  • Клоны таблиц обеспечивают возможность восстановления данных в случае сбоя выпуска или повреждения данных, сохраняя предыдущее состояние данных.
  • Клоны таблиц помогают создавать исторические отчеты, которые отражают состояние данных, как оно существовало в течение определенной точки во времени в прошлом.
  • Клоны таблиц в определенный момент времени могут сохранять состояние данных в определенных бизнес-точках во времени.

Команды CREATE TABLE AS CLONE OF T-SQL можно использовать для создания клона таблицы. Для ознакомления с учебными материалами, см. Учебник: клонирование таблицы с помощью T-SQL в хранилище или Учебник: клонирование таблиц на портале Fabric.

Вы также можете запрашивать данные в хранилище, как оно появилось в прошлом, используя синтаксис T-SQL OPTION . Дополнительные сведения см. в разделе Запрос данных в прошлом.

Что такое клон нулевого копирования?

Клон с нулевым копированием создаёт реплику таблицы, копируя метаданные, при этом ссылается на те же самые файлы данных в OneLake. Метаданные копируются, пока базовые данные таблицы, хранящиеся в виде файлов parquet, не копируются. Создание клона аналогично созданию таблицы в хранилище в Microsoft Fabric.

Клонирование таблицы в хранилище данных Fabric

В хранилище клон таблицы можно создать практически мгновенно с помощью простого T-SQL. Клон таблицы можно создать внутри или между схемами в хранилище.

Создание клона таблицы

Клон таблицы можно создать на основе одного из следующих вариантов:

  • Текущий момент времени: клон основан на текущем состоянии таблицы.

  • Предыдущий момент времени: клон основан на точке во времени до тридцати дней в прошлом. Клон таблицы содержит данные, как он отображался в нужном прошлом моменте времени. В отрасли эта функция называется "путешествие по времени". Новая таблица создается с меткой времени на основе UTC. Для примеров см. Клонирование таблицы по состоянию на прошлый момент времени или СОЗДАТЬ ТАБЛИЦУ КАК КЛОН.

Вы также можете клонировать группу таблиц одновременно. Это может быть полезно для клонирования группы связанных таблиц в тот же прошлый момент времени. Пример см. в разделе "Клонирование нескольких таблиц одновременно".

Вы также можете запрашивать данные из таблиц в том виде, в котором они существовали в прошлом, используя функцию путешествия во времени в хранилище.

Хранение данных

Хранилище автоматически хранит и поддерживает журнал данных в течение тридцати календарных дней, что позволяет создавать клоны в определенный момент времени. Все вставки, обновления и удаления, сделанные в хранилище данных, сохраняются в течение тридцати календарных дней.

Количество клонов, созданных как внутри, так и между схемами, не ограничено.

Отдельные и независимые

После создания клон таблицы является независимой и отдельной копией данных из источника.

  • Любые изменения, внесенные с помощью DML или DDL в исходной таблице для клонирования, не отражаются в клонированной таблице.
  • Аналогичным образом любые изменения, внесенные через DDL или DML в клоне таблицы, не отражаются на источнике клонирования таблицы.

Разрешения на создание клона таблицы

Для создания клона таблицы требуются следующие разрешения:

Удаление клона таблицы

Из-за его автономного существования исходный источник и клоны можно удалить без каких-либо ограничений. После создания клона он остается в существовании до удаления пользователем.

Наследование клона таблицы

Описанные здесь объекты включаются в клон таблицы:

  • Клонирование таблицы наследует безопасность SQL на уровне объекта из исходной таблицы клона. Так как роли рабочей области предоставляют доступ на чтение по умолчанию, разрешение DENY можно задать в клоне таблицы при необходимости.

  • Клонирование таблицы наследует безопасность на уровне строк (RLS) и динамическое маскирование данных из источника клонирования таблицы.

  • Клонирование таблицы наследует все атрибуты, существующие в исходной таблице, независимо от того, был ли клон создан в одной схеме или в разных схемах в хранилище.

  • Клонирование таблицы наследует ограничения первичного и уникального ключа, определенные в исходной таблице.

  • Журнал разностных данных только для чтения создается для каждого клона таблицы, созданной в хранилище. Файлы данных, хранящиеся в виде файлов delta parquet, доступны только для чтения. Это гарантирует, что данные всегда защищены от повреждения.

Сценарии клонирования таблиц

Рассмотрите возможность клонировать таблицы практически мгновенно и с минимальными затратами на хранение в следующих полезных сценариях:

Разработка и тестирование

Клоны таблиц позволяют разработчикам и тестировщикам экспериментировать, проверять и уточнять таблицы, не влияя на таблицы в рабочей среде. Клон предоставляет безопасное и изолированное пространство для проведения действий по разработке и тестированию новых функций, обеспечивая целостность и стабильность рабочей среды. Используйте клон таблицы, чтобы быстро создать копию среды, похожей на рабочую, для устранения неполадок, экспериментирования, разработки и тестирования.

Согласованные отчеты, исследование данных и моделирование машинного обучения

Для поддержания постоянно изменяющегося ландшафта данных частое выполнение заданий ETL является важным. Клоны таблиц поддерживают эту цель, обеспечивая целостность данных, обеспечивая гибкость создания отчетов на основе клонированных таблиц, в то время как фоновая обработка продолжается. Кроме того, клоны таблиц позволяют воспроизвести предыдущие результаты для моделей машинного обучения. Они также способствуют получению ценных аналитических сведений для изучения и анализа исторических данных.

Низкая стоимость, почти мгновенное восстановление

В случае случайной потери данных или повреждения существующие клоны таблиц можно использовать для восстановления таблицы до предыдущего состояния.

архивация данных;

Для аудита или соответствия нормативным требованиям можно легко использовать клоны нулевого копирования для создания копий данных, которые существовали в определенный момент времени в прошлом. Некоторые данные могут быть архивироваться для долгосрочного хранения или соответствия юридическим требованиям. Клонирование таблицы в различных исторических точках гарантирует сохранение данных в исходной форме.

Ограничения

  • Клоны таблиц в разных хранилищах в рабочей области в настоящее время не поддерживаются.
  • В настоящее время клоны таблиц в рабочих областях не поддерживаются.
  • Функция клонирования таблиц не поддерживается на SQL-аналитической конечной точке в Lakehouse.
  • Клонирование хранилища или схемы в настоящее время не поддерживается.
  • Клоны таблиц, отправленные до срока хранения тридцати дней, не могут быть созданы.
  • Изменения в схеме таблицы препятствуют созданию клона до изменения схемы таблицы.

Следующий шаг