Поделиться через


Копирование из хранилища BLOB-объектов Azure в Lakehouse

В этом руководстве вы создадите конвейер данных для перемещения CSV-файла из входной папки хранилища Azure Blob Storage в хранилище данных Lakehouse.

Предварительные условия

Чтобы приступить к работе, необходимо выполнить следующие предварительные требования:

  • Убедитесь, что у вас есть рабочая область с поддержкой Project Microsoft Fabric: создайте рабочую область.

  • Нажмите кнопку "Попробовать сейчас!", чтобы подготовить источник данных Azure Blob Storage для модуля Copy. Создайте новую группу ресурсов для этого Хранилища BLOB-объектов Azure и выберите Просмотр + Создание>Создать.

    Снимок экрана: экран сведений о проекте.

    Затем создается Хранилище BLOB-объектов Azure и moviesDB2.csv отправляется в входную папку созданного Хранилище BLOB-объектов Azure.

    Снимок экрана: расположение нового хранилища в папке.

Создание конвейера данных

  1. Переключитесь на фабрику данных на странице app.powerbi.com.

  2. Создайте рабочую область для этой демонстрации.

    Снимок экрана: экран рабочей области.

  3. Выберите «Создать», а затем выберите «Конвейер данных».

    Снимок экрана: меню

Копирование данных с помощью помощника по копированию

В этом сеансе вы начнете создавать конвейер данных, выполнив следующие действия. Эти действия копируют CSV-файл из папки входящих файлов облака Azure Blob Storage в место назначения Lakehouse с помощью помощника по копированию.

Шаг 1. Начало работы с помощником по созданию копий

  1. Выберите инструмент копирования данных на холсте, чтобы открыть помощника по копированию для начала работы. Или выберите «Использовать помощник по копированию» из раскрывающегося списка «Копирование данных» на вкладке «Действия» в ленте.

    Снимок экрана: два варианта выбора помощника по копированию.

Шаг 2. Настройка источника

  1. Введите большой двоичный объект в фильтре выбора, а затем выберите "Большие двоичные объекты Azure" и нажмите кнопку "Далее".

    Снимок экрана, где выбрать Azure Blob Storage в качестве источника данных.

  2. Укажите имя учетной записи или URL-адрес и создайте подключение к источнику данных, выбрав в раскрывающемся списке "Создать новое подключение".

    Снимок экрана: место для выбора нового подключения.

    1. Выбрав Создать новое подключение с указанной учетной записью хранения, необходимо заполнить только тип проверки подлинности. В этой демонстрации мы выбираем ключ учетной записи, но вы можете выбрать другой тип проверки подлинности в зависимости от вашего предпочтения.

      Снимок экрана: экран подключения к источнику данных помощника по копированию данных.

    2. После успешного создания подключения необходимо только выбрать "Далее" для подключения к источнику данных.

  3. Выберите файл moviesDB2.csv в исходной конфигурации для предварительной версии, а затем нажмите кнопку "Далее".

    Снимок экрана: выбор источника данных.

Шаг 3. Настройка назначения

  1. Выберите Lakehouse.

    Скриншот, показывающий диалоговое окно «Выбор места назначения данных» с выбранным вариантом Lakehouse.

  2. Укажите имя нового Lakehouse. Затем нажмите кнопку "Создать" и подключиться.

    Снимок экрана, показывающий диалоговое окно

  3. Настройте и сопоставите исходные данные с назначением; затем нажмите кнопку "Далее ", чтобы завершить конфигурации назначения.

    Снимок экрана: диалоговое окно

Шаг 4. Просмотр и создание действия копирования

  1. Просмотрите параметры действия копирования на предыдущих шагах и нажмите кнопку "Сохранить и запустить ", чтобы завершить работу. Вы также можете вернуться к предыдущим шагам, чтобы изменить параметры при необходимости в средстве.

    Снимок экрана, показывающий экран проверки и создания в диалоговом окне помощника по копированию данных.

  2. После завершения активность копирования добавляется на полотно конвейера данных и выполняется непосредственно, если вы оставили флажок "Немедленно запустить передачу данных" выделенным.

    Снимок экрана, показывающий завершенное действие копирования.

Запуск и планирование конвейера данных

  1. Если вы не оставили флажок "Начать передачу данных" на странице "Просмотр и создание", перейдите на вкладку "Главная" и нажмите кнопку "Выполнить". Затем нажмите кнопку "Сохранить и запустить".

    Снимок экрана: кнопка запуска действие Copy на вкладке

    Снимок экрана: диалоговое окно «Сохранить и запустить» для действия Copy.

  2. На вкладке "Выходные данные" выберите ссылку с названием вашей операции Copy, чтобы отслеживать ход выполнения и проверять результаты.

    Снимок экрана: кнопка

  3. В диалоговом окне "Копирование данных" отображаются результаты выполнения, включая состояние, объем данных, чтение и запись, время запуска и остановки, а также длительность.

    Снимок экрана: диалоговое окно

  4. Вы также можете запланировать запуск конвейера с определенной частотой. В следующем примере показано, как запланировать запуск конвейера каждые 15 минут.

    Снимок экрана: диалоговое окно настройки расписания.

    Снимок экрана: конвейер с настроенным расписанием для выполнения каждые 15 минут.

Конвейер в этом примере показывает, как скопировать данные из хранилища Azure Blob Storage в lakehouse. Вы научились выполнять следующие задачи:

  • Создайте конвейер данных.
  • Скопируйте данные с помощью помощника по копированию.
  • Запустите и запланируйте конвейер данных.

Затем перейдите к дополнительным сведениям о мониторинге выполнения конвейера.