Загрузка данных в Azure Data Lake Storage Gen2 с помощью Azure Data Factory

ПРИМЕНИМО К: Azure Data Factory Azure Synapse Analytics

Совет

Data Factory в Microsoft Fabric — это следующее поколение Azure Data Factory с более простой архитектурой, встроенным ИИ и новыми функциями. Если вы не знакомы с интеграцией данных, начните с Fabric Data Factory. Существующие рабочие нагрузки ADF могут обновляться до Fabric для доступа к новым возможностям в области обработки и анализа данных, аналитики в режиме реального времени и отчетов.

Azure Data Lake Storage Gen2 — это набор возможностей, предназначенных для аналитики больших данных, встроенных в хранилище BLOB-объектов Azure. Она позволяет работать с данными с использованием как файловой системы, так и парадигмы хранения объектов.

Azure Data Factory (ADF) — это полностью управляемая облачная служба интеграции данных. Эту службу можно использовать для заполнения озера данными из богатого набора локальных и облачных хранилищ данных и экономии времени при создании аналитических решений. Для получения подробного списка поддерживаемых коннекторов см. таблицу Поддерживаемые хранилища данных.

Azure Data Factory предлагает решение для горизонтального масштабирования, управляемого перемещения данных. Благодаря архитектуре горизонтального масштабирования ADF, он может обрабатывать данные с высокой пропускной способностью. Дополнительные сведения см. в разделе производительность операции копирования.

В этой статье показано, как использовать инструмент копирования данных Data Factory для загрузки данных из службы Amazon Web Services S3 в Azure Data Lake Storage Gen2. Чтобы копировать данные из других типов хранилищ, необходимо выполнить аналогичные шаги.

Совет

Сведения о копировании данных из Azure Data Lake Storage Gen1 в 2-го поколения см. в пошаговом руководстве.

Предварительные условия

Подписка на Azure: Если у вас нет подписки Azure, создайте бесплатную учетную запись free перед началом работы.
учетная запись Azure Storage с включенным Data Lake Storage Gen2. Если у вас нет учетной записи хранения, создайте учетную запись.
Учетная запись AWS с контейнером S3, в котором содержатся данные. В этой статье показано, как скопировать данные из Amazon S3. Вы можете использовать другие хранилища данных, выполнив аналогичные действия.

Создание фабрики данных

Если вы еще не создали фабрику данных, следуйте шагам в разделе Быстрый старт: создание фабрики данных с помощью портала Azure и Azure Data Factory Studio. После создания перейдите к фабрике данных на портале Azure.

Главная страница для Azure Data Factory с плиткой Open Azure Data Factory Studio.
Выберите Open на плитке Open Azure Data Factory Studio, чтобы запустить приложение интеграции данных на отдельной вкладке.