Поделиться через


Модуль 1. Создание конвейера с помощью фабрики данных

Этот модуль выполняется за 10 минут, импортируя необработанные данные из исходного хранилища в бронзовую таблицу хранилища данных с помощью выполнения операции копирования в конвейере.

Высокоуровневые шаги в модуле 1 приведены следующим образом:

  1. Создайте конвейер данных.
  2. Используйте действие копирования в конвейере для загрузки примеров данных в Data Lakehouse.

Создание конвейера данных

  1. Требуется учетная запись клиента Microsoft Fabric с активной подпиской. Создайте бесплатную учетную запись.

  2. Убедитесь, что у вас есть рабочая область с поддержкой Microsoft Fabric: создать рабочую область.

  3. Войдите в Power BI.

  4. Щелкните значок Power BI по умолчанию в нижней левой части экрана и выберите Fabric.

    снимок экрана, показывающий выбор интерфейса фабрики данных.

  5. Выберите рабочую область на вкладке рабочих областей, а затем выберите + Создать элементи выберите конвейер данных. Укажите имя конвейера. Затем выберите Создать.

    снимок экрана начальной страницы фабрики данных с кнопкой, чтобы создать выбранный конвейер данных.

    снимок экрана, показывающий диалоговое окно, чтобы указать новое имя конвейера.

Используйте действие Copy в конвейере для загрузки примеров данных в Data Lakehouse

Шаг 1. Используйте помощник по копированию для настройки действия копирования.

Выберите помощник по копированию данных , чтобы открыть средство помощника по копированию.

Снимок экрана, показывающий выбор действия

Шаг 2. Настройка параметров в помощнике по копированию.

  1. Диалоговое окно Копирование данных отображается с первым шагом, Выбор источника данных, выделенным. Выберите Примеры данных из параметров в верхней части диалогового окна, а затем выберите Нью-Йоркское зелёное такси.

    Скриншот, показывающий выбор данных

  2. Предварительный просмотр источника данных появится на странице Подключение к источнику данных. Проверьте и выберите Далее.

    Снимок экрана, показывающий предварительные данные для образца данных

  3. На шаге выбора назначения данных помощника по копированию выберите Lakehouse.

    снимок экрана, отображающий выбор пункта назначения Lakehouse на вкладке

  4. Введите имя Lakehouse, а затем нажмите кнопку "Создать" и подключиться.

    скриншот, показывающий страницу конфигурации назначения данных в помощнике по копированию, с выбором опции

  5. Теперь настройте сведения о назначении Lakehouse на странице Выберите и сопоставьте с путем к папке или таблице. Выберите таблицы для корневой папки и загрузите новую таблицу для параметров загрузки. Укажите имя таблицы и нажмите кнопку "Далее".

    снимок экрана, на котором показана вкладка

  6. Наконец, на странице Проверка и сохранение помощника по копированию данных просмотрите конфигурацию. В этом руководстве снимите флажок Начать передачу данных сразу же, так как мы запускаем действие вручную на следующем шаге. Затем выберите ОК.

    снимок экрана: помощник по копированию данных на странице проверки и сохранения.

Шаг 3. Запустите и просмотрите результаты действия копирования.

  1. В редакторе конвейера выберите вкладку "Запуск". Затем нажмите кнопку Запустить, а затем в появившемся окне выберите Сохранить и запустить, чтобы выполнить действие копирования.

    Снимок экрана, показывающий вкладку

    снимок экрана: диалоговое окно

  2. Вы можете отслеживать выполнение и проверять результаты на вкладке выходных данных под холстом конвейера. Нажмите кнопку для просмотра сведений о выполнении (значок в виде очков, который отображается при наведении указателя мыши на запущенный конвейер), чтобы просмотреть сведения о выполнении.

    Снимок экрана, показывающий кнопку

  3. Подробности выполнения показывают, что считано и записано 1 508 501 строк.

    Снимок экрана сведений о копировании данных для запуска конвейера.

  4. Разверните раздел разбивки по длительности, чтобы увидеть продолжительность каждого этапа процесса копирования. После просмотра деталей копии выберите Закрыть.

    снимок экрана, показывающий длительность выполнения действия копирования.

В этом первом модуле нашего комплексного руководства для первой интеграции данных с помощью Data Factory в Microsoft Fabric вы узнали, как:

  • Создайте конвейер данных.
  • Добавьте действие "Копирование" в ваш конвейер.
  • Используйте образцы данных и создайте хранилище данных Lakehouse для их хранения в новой таблице.
  • Запустите конвейер и просмотрите его подробности и распределение по времени.

Перейдите к следующему разделу, чтобы создать поток данных.