Настройте MongoDB в процессе копирования

В этой статье описывается, как использовать действие копирования в конвейере для копирования данных из MongoDB и в нее.

Поддерживаемая конфигурация

Для настройки каждой вкладки в действии копирования перейдите к следующим разделам соответственно.

Общая информация

Ознакомьтесь с руководством по общим параметрам , чтобы настроить вкладку "Общие параметры".

Исходный материал

Перейдите на вкладку Источник, чтобы настроить источник операции копирования. См. следующее содержимое для подробной конфигурации.

снимок экрана: вкладка источника и список свойств.

Требуются следующие свойства:

  • Подключение. Выберите подключение MongoDB из списка подключений. Если подключение отсутствует, создайте новое подключение MongoDB, нажав кнопку "Создать".
  • База данных: выберите базу данных из раскрывающегося списка.
  • Имя коллекции: укажите имя коллекции в базе данных MongoDB. Вы можете выбрать коллекцию из раскрывающегося списка или выбрать команду "Изменить ", чтобы ввести ее вручную.
  • Версия: указанная версия. Рекомендуется обновить до последней версии, чтобы воспользоваться новыми улучшениями. Чтобы узнать разницу между различными версиями, перейдите в этот раздел.

В разделе "Дополнительно" можно указать следующие поля:

  • Фильтр. Задает фильтр выбора с помощью операторов запросов. Чтобы вернуть все документы в коллекции, опустите этот параметр или передайте пустой документ ({}).
  • Методы курсора: выберите +Создать , чтобы указать способ выполнения базового запроса. Способы выполнения запроса:
    • проект. Указывает поля, возвращаемые в документах для проекции. Чтобы вернуть все поля в соответствующих документах, опустите этот параметр.
    • сортировка: указывает порядок, в котором запрос возвращает соответствующие документы. Дополнительные сведения см. в cursor.sort().
    • ограничение. Указывает максимальное количество документов, возвращаемых сервером. Дополнительные сведения см. в cursor.limit( ).
    • skip: указывает количество документов, которые нужно пропустить и откуда MongoDB начинает возвращать результаты. Дополнительные сведения см. в cursor.skip( ).
  • Размер пакета: указывает количество документов, возвращаемых в каждом пакете ответа из экземпляра MongoDB. В большинстве случаев изменение размера пакета не повлияет на пользователя или приложение.
  • Дополнительные столбцы: добавьте дополнительные столбцы данных для хранения относительного пути или статического значения исходных файлов. Выражение поддерживается для последнего варианта.

Место назначения

Перейдите на вкладку Пункт назначения, чтобы настроить место назначения для действия копирования. См. следующее содержимое для подробной конфигурации.

Требуются следующие свойства:

  • Подключение. Выберите подключение MongoDB из списка подключений. Если подключение отсутствует, создайте новое подключение MongoDB, нажав кнопку "Создать".
  • База данных: выберите базу данных из раскрывающегося списка.
  • Имя коллекции: укажите имя коллекции в базе данных MongoDB. Вы можете выбрать коллекцию из раскрывающегося списка или выбрать команду "Изменить ", чтобы ввести ее вручную.

В разделе "Дополнительно" можно указать следующие поля:

  • Поведение записи: описывает запись данных в MongoDB. Допустимые значения: Insert и Upsert.

    Поведение Upsert заключается в замене документа, если документ с таким же _id уже существует; в противном случае выполняется вставка документа.

    Замечание

    Служба автоматически создает _id для документа, если _id не указан ни в исходном документе, ни при сопоставлении столбцов. Это означает, что вы должны убедиться, что для правильной работы Upsert ваш документ имеет идентификатор.

  • время ожидания пакетной записи: укажите время ожидания завершения операции пакетной вставки перед истечением тайм-аута. Допустимое значение — интервал времени.

  • Размер пакета записи: это свойство определяет размер пакета документов для записи в каждом пакете. Вы можете попытаться увеличить значение, чтобы повысить производительность и уменьшить значение, если размер документа велик.

Картирование

Сведения о настройке вкладки "Сопоставление " см. в разделе "Настройка сопоставлений" на вкладке "Сопоставление". Сопоставление не поддерживается, если исходные и целевые данные являются иерархическими данными.

Сопоставление типов данных для MongoDB

При копировании данных из MongoDB следующие сопоставления используются из типов данных MongoDB к промежуточным типам данных, используемым службой внутри службы.

Тип данных MongoDB Тип данных промежуточной службы (для версии 1.1) Тип данных промежуточной службы (для версии 1.0)
Дата дата и время Int64
ObjectId (идентификатор объекта) Струна Струна
Десятичная 128 Струна Струна
Метка времени Самые значительные 32 бита —> DateTime
Наименее значимые 32 бита -> Int64
Самые значительные 32 бита -> Int64
Наименее значимые 32 бита -> Int64
Струна Струна Струна
Двойной Двойной Двойной
Int32 Int64 Int64
Int64 Int64 Int64
Булевый Булевый Булевый
Недействительный Недействительный Недействительный
JavaScript Струна Струна
Регулярное выражение Струна Струна
Минимальный ключ Струна Int64
Максимальный ключ Струна Int64
Бинарный GUID (если подтип имеет значение "04" )
Струна
Струна

Настройки

Для настройки вкладки перейдите к Настройка других параметров на вкладке "Параметры".

Различия между версиями MongoDB

В таблице ниже показаны различия функций между различными версиями.

Версия 1.1 Версия 1.0
Используются следующие сопоставления типов данных из MongoDB с промежуточными типами данных службы.

Дата —> дата и время
TimeStamp (наиболее значимые 32 бита) —> DateTime
Min key —> String
Максимальное значение ключа —> Строка
Binary —> GUID (если подтип имеет значение "04") / String
Используются следующие сопоставления типов данных из MongoDB с промежуточными типами данных службы.

Дата —> Int64
Метка времени (32 наиболее значимых бита) —> Int64
Min key —> Int64
Максимальный ключ —> Int64
Двоичное:> строка

Сводка таблицы

В следующей таблице содержатся дополнительные сведения о действии копирования в MongoDB.

Исходная информация

Имя Описание Ценность Обязательно Свойство скрипта JSON
Подключение Ваше подключение к исходному хранилищу данных. < ваше подключение MongoDB > Да подключение
База данных Ваша база данных, которую вы используете в качестве источника. < ваша база данных > Да база данных
Имя коллекции Имя коллекции в базе данных MongoDB < ваша коллекция > Да коллекция
Версия Версия, которую вы указали. • 1.1
• 1.0
Да Версия:
• 1.1
• 1.0
Фильтр Фильтр выбора с помощью операторов запросов. Чтобы вернуть все документы в коллекции, опустите этот параметр или передайте пустой документ ({}). < ваш фильтр выбора > нет фильтр
Методы курсора Способ выполнения базового запроса. • project
сортировка
ограничение
пропустить
нет cursorMethods:
•проект
•сортировать
• предел
•пропустить
Размер пакета Количество документов, возвращаемых в каждом пакете ответа из базы данных MongoDB. < размер пакета записи >
(значение по умолчанию — 100)
нет размер партии
Дополнительные столбцы Добавьте дополнительные столбцы данных для хранения относительного пути или статического значения исходных файлов. Выражение поддерживается для последнего варианта. •Имя
•Ценность
нет дополнительныеКолонки
•имя
•ценность

Сведения о назначении

Имя Описание Ценность Обязательно Свойство скрипта JSON
Подключение Подключение к целевому хранилищу данных. < ваше подключение MongoDB > Да подключение
База данных Ваша база данных, используемая как место назначения. < ваша база данных > Да база данных
Имя коллекции Имя коллекции в базе данных MongoDB < ваша коллекция > Да коллекция
Поведение при записи Описание процесса записи данных в MongoDB. Допустимые значения: Insert и Upsert.

Поведение Upsert заключается в замене документа, если документ с таким же _id уже существует; в противном случае выполняется вставка документа.

Примечание. Служба автоматически создает _id, если _id не указан ни в исходном документе, ни по сопоставлению столбцов. Это означает, что вы должны убедиться, что для правильной работы Upsert ваш документ имеет идентификатор.
Вставка (по умолчанию)
Upsert
нет writeBehavior:
• вставить
• добавление или обновление записи
время ожидания выполнения пакета Время ожидания завершения операции пакетной вставки перед истечением времени ожидания. временной промежуток
(значение по умолчанию — 00:30:00 – 30 минут)
нет writeBatchTimeout
размер пакета записи Определяет размер документов для записи в каждом пакете. Вы можете попытаться увеличить это значение, чтобы повысить производительность и уменьшить значение, если размер документа большой. < размер пакета записи > нет writeBatchSize