Поделиться через


Быстрый старт: используйте средство копирования данных в Azure Data Factory Studio для копирования данных

ОБЛАСТЬ ПРИМЕНЕНИЯ: Фабрика данных Azure Azure Synapse Analytics

Совет

Попробуйте использовать фабрику данных в Microsoft Fabric, решение для аналитики с одним интерфейсом для предприятий. Microsoft Fabric охватывает все, от перемещения данных до обработки и анализа данных в режиме реального времени, бизнес-аналитики и отчетности. Узнайте, как бесплатно запустить новую пробную версию !

В этом кратком руководстве вы используете средство копирования данных в Azure Data Factory Studio для создания конвейера, копирующий данные из исходной папки в хранилище BLOB-объектов Azure в целевую папку.

Предварительные требования

Подписка Azure.

Если у вас нет подписки Azure, создайте бесплатную учетную запись, прежде чем приступить к работе.

Подготовьте исходные данные в Azure Blob Storage.

Чтобы подготовить исходные данные с помощью шаблона:

  1. Нажмите следующую кнопку.

    Пробная демонстрация фабрики данных

  2. Вы направляетесь на страницу конфигурации для развертывания шаблона. На этой странице:

    1. Для группы ресурсов выберите "Создать" , чтобы создать группу ресурсов. Вы можете оставить все остальные значения по умолчанию.

    2. Выберите "Просмотр и создание", а затем выберите "Создать", чтобы развернуть ресурсы.

    Снимок экрана: страница развертывания шаблона для создания ресурсов.

Примечание.

Пользователь, который развертывает шаблон, должен назначить роль управляемому удостоверению. На этом шаге требуются разрешения, которые можно предоставить с помощью роли "Владелец", "Администратор доступа пользователей" или "Оператор управляемого удостоверения".

В новой группе ресурсов создается новая учетная запись BLOB-хранилища. Файл moviesDB2.csv хранится в папке с именем input в Blob-хранилище.

Создание фабрики данных

Вы можете использовать существующую фабрику данных или создать новую, как описано в кратком руководстве. Создание фабрики данных.

Копирование данных с помощью средства копирования данных

Средство копирования данных содержит пять страниц, которые проводят вас через процесс копирования данных шаг за шагом. Чтобы запустить средство, выполните следующие действия.

  1. В Azure Data Factory Studio перейдите в ваш центр обработки данных.

  2. Выберите плитку импорта данных.

Снимок экрана, показывающий страницу фабрики данных и плитку Ingest в Azure Data Factory Studio.

Шаг 1. Выбор типа задачи

  1. На странице "Свойства " средства копирования данных выберите встроенную задачу копирования в поле "Тип задачи".

  2. Выберите Далее.

Снимок экрана: страница

Шаг 2. Полная конфигурация источника

  1. На странице "Источник " средства копирования данных нажмите кнопку "Создать новое подключение ", чтобы добавить подключение.

  2. Выберите тип связанной службы, которую нужно создать для подключения к источнику. (В этом кратком руководстве используется хранилище BLOB-объектов Azure.) Затем нажмите кнопку "Продолжить".

    Снимок экрана: коллекция типов служб в диалоговом окне для нового подключения с выбранным хранилищем BLOB-объектов Azure.

  3. В диалоговом окне "Новое подключение" (Azure Blob Storage) выполните следующие действия.

    1. В поле "Имя" укажите имя подключения.
    2. В разделе "Метод выбора учетной записи" выберите "Из подписки Azure".
    3. В списке подписок Azure выберите свою подписку Azure.
    4. В списке имен учетной записи хранения выберите учетную запись хранения.
    5. Выберите "Проверить подключение" и убедитесь, что подключение выполнено успешно.
    6. Выберите Создать.

    Снимок экрана, который показывает сведения о конфигурации учетной записи BLOB-хранилища Azure.

  4. В разделе хранилища данных источника:

    1. Для подключения выберите только что созданное соединение.
    2. В разделе "Файл" или "Папка " выберите "Обзор ", чтобы перейти к папке adftutorial/input . Выберите файлmoviesDB2.csv и нажмите кнопку "ОК".
    3. Установите флажок "Двоичная копия" , чтобы скопировать файл как есть.
    4. Выберите Далее.

    Снимок экрана: параметры для исходного хранилища данных.

Шаг 3. Завершение настройки назначения

  1. На странице Цель средства Копирование данных для Соединение выберите созданное соединение AzureBlobStorage.

  2. В разделе Пути к папке введите adftutorial/output.

    Снимок экрана: параметры для целевого хранилища данных.

  3. Оставьте другие параметры по умолчанию. Выберите Далее.

Шаг 4. Введите имя и описание конвейера

  1. На странице "Параметры " средства копирования данных укажите имя конвейера и его описание.

  2. Нажмите кнопку "Далее", чтобы использовать другие конфигурации по умолчанию.

    Снимок экрана: страница

Шаг 5. Проверка параметров и развертывание

  1. На странице "Проверка и завершение " просмотрите все параметры.

  2. Выберите Далее.

На странице завершения развертывания показано, выполнено ли развертывание успешно.

Отслеживайте текущие результаты

После завершения копирования данных можно отслеживать созданный конвейер:

  1. На странице завершения развертывания выберите "Монитор".

    Скриншот страницы, показывающий завершенное развертывание.

  2. Приложение переключается на вкладку "Монитор ", в которой отображается состояние конвейера. Выберите "Обновить" , чтобы обновить список конвейеров. Выберите ссылку в разделе "Имя конвейера ", чтобы просмотреть сведения о выполнении действия или повторно запустить конвейер.

    Снимок экрана: кнопка обновления списка конвейеров.

  3. На странице с подробными сведениями о выполнении действия выберите ссылку "Сведения " (значок очки) в столбце имени действия для получения дополнительных сведений об операции копирования. Дополнительные сведения о свойствах см. в обзорной статье о действии копирования.

Конвейер в этом примере копирует данные из одного местоположения в другое в хранилище Blob Azure. Дополнительные сведения об использовании Data Factory в различных сценариях см. в следующем руководстве.