Прочитать на английском

Поделиться через


Начало работы с фабрикой данных Azure

ОБЛАСТЬ ПРИМЕНЕНИЯ: Фабрика данных Azure Azure Synapse Analytics

Совет

Попробуйте использовать фабрику данных в Microsoft Fabric, решение для аналитики с одним интерфейсом для предприятий. Microsoft Fabric охватывает все, от перемещения данных до обработки и анализа данных в режиме реального времени, бизнес-аналитики и отчетности. Узнайте, как бесплатно запустить новую пробную версию !

Добро пожаловать в Фабрика данных Azure! Эта статья поможет вам создать первую фабрику данных и конвейер в течение пяти минут.

Шаблон Azure Resource Manager (шаблон ARM) в этой статье создает и настраивает все необходимое. Затем можно перейти в демонстрационную фабрику данных и активировать конвейер, который перемещает некоторые примеры данных из одной папки хранилища BLOB-объектов Azure в другую.

Предварительные условия

Если у вас нет подписки Azure, создайте бесплатную учетную запись, прежде чем приступить к работе.

Краткий видеообзор

В следующем видео показано пошаговое руководство по примеру в этой статье:

Шаг 1. Использование демонстрации для создания ресурсов

В этом демонстрационном сценарии вы используете действие копирования в конвейере данных для того, чтобы скопировать большой двоичный объект с именем moviesDB2.csv из входной папки в Azure Blob Storage в выходную папку. В реальном сценарии эта операция копирования может находиться между любым из многих поддерживаемых источников данных и приемников, доступных в службе. Он также может включать преобразования в данные.

  1. Нажмите следующую кнопку.

    Пробная демонстрация фабрики данных

    При нажатии кнопки создаются следующие ресурсы Azure:

    • Учетная запись фабрики данных Azure
    • Фабрика данных, содержащая конвейер с одним действием копирования
    • Учетная запись хранения Blob-объектов Azure, в которую загружен moviesDB2.csv, помещена в папку входных данных в качестве источника.
    • Связанная служба для подключения фабрики данных к хранилищу блобов
  2. Вы направляетесь на страницу конфигурации для развертывания шаблона. На этой странице:

    1. Для группы ресурсов выберите "Создать" , чтобы создать группу ресурсов. Вы можете оставить все остальные значения по умолчанию.

    2. Выберите "Просмотр и создание", а затем выберите "Создать", чтобы развернуть ресурсы.

    Снимок экрана: страница развертывания шаблона для создания ресурсов.

Примечание

Пользователь, который развертывает шаблон, должен назначить роль управляемому удостоверению. На этом шаге требуются разрешения, которые можно предоставить с помощью роли "Владелец", "Администратор доступа пользователей" или "Оператор управляемого удостоверения".

Все ресурсы в этой демонстрации создаются в новой группе ресурсов, поэтому их можно легко очистить позже.

Шаг 2. Проверка развернутых ресурсов

  1. В сообщении, показывающем успешное завершение развертывания, выберите Перейти к группе ресурсов.

    Снимок экрана: страница портала Azure, на котором показано успешное развертывание демонстрационного шаблона.

  2. Группа ресурсов включает в себя новую фабрику данных, учетную запись Blob-хранилища и управляемое удостоверение, созданное развертыванием. Выберите фабрику данных в группе ресурсов, чтобы просмотреть её.

    Скриншот содержимого группы ресурсов, созданной для демонстрации, с выделенной фабрикой данных.

  3. Нажмите кнопку "Запустить студию ".

    Снимок экрана: портал Azure, на котором показаны сведения о созданной фабрике данных, с выделенной кнопкой открытия Студии фабрики данных Azure.

  4. В Azure Data Factory Studio:

    1. Выберите вкладку Авторвкладка .
    2. Выберите конвейер, созданный шаблоном.
    3. Проверьте исходные данные, нажав кнопку "Открыть".

    Снимок экрана студии Azure Data Factory, показывающий конвейер, созданный шаблоном.

  5. В исходном наборе данных выберите "Обзор ", чтобы просмотреть входной файл, созданный для демонстрации.

    Снимок экрана: исходный набор данных с выделенной кнопкой

    Обратите внимание на файл moviesDB2.csv, который уже был отправлен в входную папку.

    Снимок экрана: содержимое входной папки, показывающее входной файл, используемый в демонстрации.

Шаг 3. Активация демонстрационного конвейера для запуска

  1. Выберите "Добавить триггер", а затем нажмите кнопку "Триггер".

    Снимок экрана: кнопка запуска демонстрационного конвейера.

  2. В области справа в разделе "Запуск конвейера" нажмите кнопку "ОК".

Мониторинг конвейера

  1. Выберите вкладку МониторингВкладка отслеживания. Эта вкладка содержит обзор запусков конвейера, включая время начала и состояние.

    Снимок экрана вкладки для мониторинга запусков конвейеров в фабрике данных.

  2. В этом кратком руководстве конвейер имеет только один тип действия: копирование данных. Выберите имя конвейера, чтобы просмотреть сведения о результатах выполнения действия копирования.

    Снимок экрана: результаты выполнения задачи копирования во вкладке мониторинга фабрики данных.

  3. Щелкните значок сведений , чтобы отобразить подробный процесс копирования. В результатах размеры считанных данных и записанных данных одинаковы, и один файл был считан и записан. Эта информация свидетельствует о том, что все данные успешно скопированы в место назначения.

    Снимок экрана с подробными результатами выполнения операции копирования.

Очистка ресурсов

Вы можете очистить все ресурсы, созданные в этой статье, двумя способами:

  • Вы можете удалить всю группу ресурсов Azure, которая включает все ресурсы, созданные в нем.

  • Если вы хотите сохранить некоторые ресурсы без изменений, перейдите в группу ресурсов и удалите только определенные ресурсы, которые требуется удалить.

    Например, если вы используете этот шаблон для создания фабрики данных для использования в другом руководстве, вы можете удалить другие ресурсы, но сохранить только фабрику данных.

В этой статье вы создали фабрику данных, содержащую конвейер с операцией копирования. Дополнительные сведения о фабрике данных Azure см. в следующей статье и модуле обучения:


Дополнительные ресурсы

Обучение

Модуль

Общие сведения о службе фабрики данных Azure, службе интеграции данных в облаке - Training

Оцените, может ли фабрика данных Azure помочь вам интегрировать источники данных. Узнайте, как Фабрика данных Azure могут получать данные из локальных, многооблачных и источников данных SaaS.

Сертификация

Microsoft Certified: Azure Data Fundamentals - Certifications

Продемонстрировать базовые знания о основных понятиях данных, связанных со службами данных Microsoft Azure.