Примечание
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Azure Data Lake Analytics будет прекращена 29 февраля 2024 г. Дополнительные сведения см. в этом объявлении.
Если вы уже используете Azure Data Lake Analytics, вы можете создать план миграции в Azure Synapse Analytics для вашей организации.
Корпорация Майкрософт запустила Azure Synapse Analytics, которая направлена на объединение озер данных и хранилища данных для уникальной аналитики больших данных. Это поможет вам собрать и проанализировать данные для решения неэффективности данных и помочь командам работать вместе. Кроме того, интеграция Synapse с Машинным обучением Azure и Power BI позволит организациям получать аналитические сведения от своих данных и выполнять машинное обучение для всех своих смарт-приложений.
В документе показано, как выполнить миграцию из Azure Data Lake Analytics в Azure Synapse Analytics.
Рекомендуемый подход
- Шаг 1. Оценка готовности
- Шаг 2. Подготовка к миграции
- Шаг 3. Перенос данных и рабочих нагрузок приложений
- Шаг 4. Переход из Azure Data Lake Analytics в Azure Synapse Analytics
Шаг 1. Оценка готовности
Ознакомьтесь с Apache Spark в Azure Synapse Analytics и изучите основные различия Azure Data Lake Analytics и Spark в Azure Synapse Analytics.
Товар Аналитика Azure Data Lake Spark в Synapse Ценообразование За единицу аналитического часа За виртуальное ядро в час Двигатель Аналитика Azure Data Lake Apache Spark Язык программирования по умолчанию U-SQL T-SQL, Python, Scala, Spark SQL и .NET Источники данных Azure Data Lake Storage Хранилище BLOB-объектов Azure, Azure Data Lake Storage Просмотрите анкету для оценки миграции и перечислить возможные риски для рассмотрения.
Шаг 2. Подготовка к миграции
Определите задания и данные, которые будут перенесены.
- Воспользуйтесь этой возможностью, чтобы удалить работы, которые вы больше не используете. Если вы не планируете переносить все задания одновременно, на этот раз определите логические группы заданий, которые можно перенести на этапах.
- Оцените размер данных и изучите формат данных Apache Spark. Просмотрите скрипты U-SQL и оцените усилия по перезаписи скриптов и изучите концепцию кода Apache Spark.
Определите влияние миграции на ваш бизнес. Например, можно ли позволить себе любое время простоя во время миграции.
Создайте план миграции.
Шаг 3. Перенос данных и рабочей нагрузки приложения
Перенос данных из Azure Data Lake Storage 1-го поколения в Azure Data Lake Storage 2-го поколения.
Azure Data Lake Storage Gen1 будет выведено из эксплуатации в феврале 2024 года, см. официальное объявление. Мы рекомендуем сначала перенести данные в 2-е поколение. Ознакомьтесь с форматами данных Apache Spark для разработчиков U-SQL Azure Data Lake Analytics и перемещайте файлы и данные, хранящиеся в таблицах U-SQL, чтобы сделать их доступными для Azure Synapse Analytics. Дополнительные сведения о руководстве по миграции см. здесь.Преобразуйте скрипты U-SQL в Spark. Ознакомьтесь с основными понятиями кода Apache Spark для разработчиков U-SQL Azure Data Lake Analytics, чтобы преобразовать скрипты U-SQL в Spark.
Преобразуйте или создайте заново конвейеры оркестрации заданий для новой программы Spark.
Шаг 4. Переход от Azure Data Lake Analytics к Azure Synapse Analytics
Убедившись, что ваши приложения и рабочие нагрузки стабильны, вы можете начать использовать Azure Synapse Analytics для удовлетворения бизнес-сценариев. Отключите все оставшиеся конвейеры, работающие в Azure Data Lake Analytics, и удалите учетные записи Azure Data Lake Analytics.
Анкета для оценки миграции
Категория | Вопросы | Справка |
---|---|---|
Оценка размера миграции | Сколько учетных записей Azure Data Lake Analytics у вас есть? Сколько конвейеров используется? Сколько сценариев U-SQL используется? | Чем больше данных и скриптов необходимо перенести, тем больше UDO/UDF используются в сценариях, тем сложнее перенести. Время и ресурсы, необходимые для миграции, должны быть хорошо запланированы в соответствии с масштабом проекта. |
Источник данных | Какой размер источника данных? Какой формат данных для обработки? | Общие сведения о форматах данных Apache Spark для разработчиков U-SQL в Azure Data Lake Analytics |
Выходные данные | Сохраните выходные данные для последующего использования? Если выходные данные сохраняются в таблицах U-SQL, как его обрабатывать? | Если выходные данные будут часто использоваться и сохранены в таблицах U-SQL, необходимо изменить скрипты и изменить выходные данные в поддерживаемый формат данных Spark. |
Миграция данных | Вы сделали план миграции хранилища? | Перенос Azure Data Lake Storage из 1-го поколения в 2-го поколения |
Преобразование скриптов U-SQL | Вы используете UDO/UDF (.NET, python и т. д.)? Если приведенный выше ответ да, какой язык вы используете в UDO/UDF и какие-либо проблемы для преобразования во время преобразования? Используется ли федеративный запрос в U-SQL? | Общие сведения о концепциях кода Apache Spark для разработчиков U-SQL в Azure Data Lake Analytics |