Поделиться через


Каковы варианты переноса данных из MongoDB в виртуальные ядра Azure Cosmos DB для MongoDB?

В этом документе описаны различные варианты для отмены и перемещения рабочих нагрузок MongoDB на виртуальные ядра в предложение Azure Cosmos DB для MongoDB.

Миграция может выполняться двумя способами:

  • Автономная миграция: массовая копия на основе моментального снимка из источника в целевой. Новые данные, добавленные или обновленные или удаленные в источнике после того, как моментальный снимок не копируется в целевой объект. Время простоя приложения зависит от времени выполнения действия массового копирования.

  • Миграция по сети. Помимо действия массового копирования данных, выполняемого в автономной миграции, поток изменений отслеживает все дополнения, обновления и удаления. После завершения массового копирования данных данные в потоке изменений копируются в целевой объект, чтобы убедиться, что все обновления, внесенные во время процесса миграции, также передаются в целевой объект. Требуется минимальное время простоя приложения.

Azure Data Studio (Online)

Расширение миграции MongoDB для Azure Data Studio — это предпочтительный инструмент при переносе рабочих нагрузок MongoDB на виртуальные ядра Azure Cosmos DB для MongoDB.

Процесс миграции состоит из двух этапов:

  • Оценка предварительной подготовки — оценка текущего объекта данных MongoDB, чтобы определить, есть ли какие-либо несовместимости.
  • Миграция — операция миграции с помощью служб, управляемых Azure.

Оценка предварительной подготовки

Оценка включает в себя определение того, используете ли вы поддерживаемые функции и синтаксис. Целью этого этапа является определение несовместимости или предупреждений, существующих в текущем решении MongoDB. Перед переходом к процессу миграции необходимо устранить проблемы, обнаруженные в результатах оценки.

Совет

Мы рекомендуем подробно просмотреть поддерживаемые функции и синтаксис и выполнить проверку концепции до фактической миграции.

Миграция

Используйте графический пользовательский интерфейс для управления всем процессом миграции с начала до конца. Миграция запускается в Azure Data Studio, но выполняется в облаке на управляемых Azure ресурсах.

Средства Native MongoDB (автономные)

Вы можете использовать собственные средства MongoDB, такие как mongodump/mongorestore, mongoexport/mongoimport для переноса наборов данных в автономном режиме (без репликации динамических изменений) в предложение Azure Cosmos DB для MongoDB.

Сценарий Собственное средство MongoDB
Перемещение поднабора данных базы (на основе JSON- или CSV-файла) mongoexport/mongoimport
Перемещение всей базы данных (на основе BSON) mongodump/mongorestore
  • mongoexport/mongoimport — это лучшая пара средств миграции для переноса подмножества вашей базы данных MongoDB.
    • mongoexport экспортирует существующие данные в JSON- или CSV-файл в понятном для человека формате. mongoexport принимает аргумент, указывающий подмножество существующих данных для экспорта.
    • mongoimport открывает JSON-файл или CSV-файл и вставляет содержимое в целевой экземпляр базы данных (в данном случае azure Cosmos DB на основе виртуальных ядер для MongoDB).
    • ФОРМАТ JSON и CSV не является компактным; Вы можете занести избыточные расходы на сеть, так как mongoimport отправляет данные на основе виртуальных ядер Azure Cosmos DB для MongoDB.
  • mongodump/mongorestore — это лучшая пара средств миграции для переноса всей базы данных MongoDB. Компактный формат BSON позволяет эффективнее использовать сетевые ресурсы, так как данные вставляются в виртуальные ядра Azure Cosmos DB для MongoDB.
    • mongodump экспортирует существующие данные в виде BSON-файла.
    • Mongorestore импортирует дамп файла BSON в виртуальные ядра Azure Cosmos DB для MongoDB.

Примечание.

Собственные средства MongoDB могут перемещать данные только так быстро, как разрешено оборудование узла.

Миграция данных с помощью Azure Databricks (автономный или онлайн)

Миграция с помощью Azure Databricks обеспечивает полный контроль скорости миграции и преобразования данных. Этот метод также может поддерживать большие наборы данных, которые находятся в размерах TBS. Служебная программа миграции Spark работает в качестве задания в Databricks.

Это средство поддерживает следующие источники MongoDB:

  • Виртуальная машина MongoDB
  • MongoDB Atlas
  • AWS DocumentDB
  • Azure Cosmos DB MongoDB RU (только в автономном режиме)

Зарегистрируйтесь для миграции Azure Cosmos DB для MongoDB Spark, чтобы получить доступ к репозиторию средства миграции Spark GitHub. Репозиторий предлагает подробные пошаговые инструкции по переносу рабочих нагрузок из различных источников Mongo в виртуальные ядра Azure Cosmos DB для MongoDB.