Поделиться через


Параметры получения данных в Fabric Lakehouse

Интерфейс получения данных охватывает все пользовательские сценарии для переноса данных в lakehouse, например:

  • Подключение для существующего SQL Server и копирования данных в таблицу Delta в lakehouse.
  • Отправка файлов с компьютера.
  • Копирование и объединение нескольких таблиц из других озерных домов в новую таблицу Delta.
  • Подключение в источник потоковой передачи для посадки данных в озерном доме.
  • Ссылка на данные без копирования из других внутренних озерных домов или внешних источников.

Различные способы загрузки данных в lakehouse

В Microsoft Fabric есть несколько способов получить данные в lakehouse:

  • Отправка файлов с локального компьютера
  • Запуск средства копирования в конвейерах
  • Настройка потока данных
  • Библиотеки Apache Spark в коде записной книжки

Отправка локального файла

Вы также можете передать данные, хранящиеся на локальном компьютере. Это можно сделать непосредственно в обозревателе Lakehouse.

Screenshot of file upload dialog in the Lakehouse explorer.

Копирование средства в конвейерах

Средство копирования — это высокомасштабируемое решение Интеграция данных, которое позволяет подключаться к разным источникам данных и загружать данные в исходном формате или преобразовывать их в таблицу Delta. Средство копирования — это часть действий конвейеров, которые можно изменить несколькими способами, например планирование или активация на основе события. Дополнительные сведения см. в разделе "Копирование данных с помощью действия копирования".

Потоки данных

Для пользователей, знакомых с потоками данных Power BI, то же средство доступно для загрузки данных в lakehouse. Вы можете быстро получить доступ к нему из параметра "Получить данные" обозревателя Lakehouse и загрузить данные из более чем 200 соединителей. Дополнительные сведения см . в кратком руководстве. Создание первого потока данных для получения и преобразования данных.

Код записной книжки

Вы можете использовать доступные библиотеки Spark для подключения к источнику данных напрямую, загрузить данные в кадр данных, а затем сохранить его в lakehouse. Этот метод является самым открытым способом загрузки данных в lakehouse, который пользовательский код полностью управляет.

Примечание.

Внешние таблицы Delta, созданные с помощью кода Spark, не будут отображаться в конечной точке аналитики SQL. Используйте сочетания клавиш в пространстве таблиц, чтобы внешние таблицы Delta отображались для конечной точки аналитики SQL.

Рекомендации при выборе подхода к загрузке данных

Вариант использования Рекомендация
Отправка небольших файлов с локального компьютера Использование локальной отправки файлов
Небольшие данные или конкретный соединитель Использование потоков данных
Большой источник данных Использование средства копирования в конвейерах
Сложные преобразования данных Использование кода записной книжки