Поделиться через


Ускоренные преобразования файлов

Shortcut transformations convert raw files into Delta tables that stay always in sync with the source data.
Преобразование выполняется вычислением Fabric Spark, которое копирует данные, на которые ссылается ярлык OneLake, в управляемую таблицу Delta, поэтому вам не нужно самостоятельно создавать и оркестрировать традиционные конвейеры ETL.

Note

Shortcut transformations are currently in public preview and are subject to change.

Зачем использовать быстрые преобразования?

  • Отсутствие ручных конвейеров — Платформа Fabric автоматически копирует и преобразует исходные файлы в Delta-формат; Вам не нужно управлять инкрементными загрузками.
  • Frequent refresh – Fabric checks the shortcut every 2 minutes and synchronizes any changes almost immediately.
  • Открытая и готовая к аналитике – Выходные данные представляют собой таблицу Delta Lake, которую может запросить любой механизм, совместимый с Apache Spark.
  • Unified governance – The shortcut inherits OneLake lineage, permissions, and Microsoft Purview policies.
  • Spark based – Transforms build for scale.

Prerequisites

Requirement Details
Microsoft Fabric SKU Capacity or Trial that supports Lakehouse workloads.
OneLake shortcut A shortcut targeting a folder that contains homogeneous CSV files.
Workspace role Contributor or higher.

Поддерживаемые источники и назначения

Формат исходного файла Destination Notes
CSV (UTF-8, разделенный запятыми) Таблица Delta Lake в папке Lakehouse / Table Во время предварительной версии будут добавлены дополнительные форматы (Parquet, JSON).

Настройка сочетания клавиш

  1. В lakehouse выберите +Создать сочетание клавиш (предварительная версия).>
  2. Choose shortcut – Browse to an existing OneLake shortcut that points to the folder with your CSV files.
  3. Configure transformation:
    • Table name – Provide a friendly name; Fabric creates it under /Tables.
    • Delimiter – Select the character used to separate columns (comma, semicolon, pipe, tab).
    • Первая строка в виде заголовков — указывает, содержит ли первая строка имена столбцов.
  4. Select Create.

Fabric Spark compute copies the data into a Delta table and shows progress in the Manage shortcuts pane.

Как работает синхронизация

После начальной загрузки вычислительная платформа Fabric Spark:

  • Опрашивает целевой объект ярлыка каждые 2 минуты.
  • Обнаруживает новые или измененные файлы и добавляет или перезаписывает строки соответствующим образом.
  • Detects deleted files and removes corresponding rows.

Мониторинг и устранение неполадок

  1. Open the lakehouse and select Shortcuts in the left pane.
  2. Выберите ярлык, который поддерживает ваше преобразование.
  3. In the details pane, select the Manage shortcut tab to view:
    • Status – Last scan result and current sync state.
    • Activity log – Chronological list of sync operations with row counts and any error details.

From this tab you can also Pause or Delete the transformation if needed.

Limitations (preview)

  • Only CSV sources are supported.
  • Файлы должны иметь идентичную схему; изменение схемы пока не поддерживается.
  • Transformations are read-optimized; MERGE INTO or DELETE statements directly on the table are blocked.
  • Available only in Lakehouse items (not Warehouses or KQL databases).

Clean up

Чтобы остановить синхронизацию, удалите трансформацию ярлыка из пользовательского интерфейса Lakehouse.
Удаление преобразования не удаляет базовые файлы.