Настройка Azure Cosmos DB для MongoDB в действии копирования

В этой статье описывается использование действия копирования в конвейерах для копирования данных из Azure Cosmos DB для MongoDB.

Поддерживаемая конфигурация

Для настройки каждой вкладки в действии копирования перейдите к следующим разделам соответственно.

General

Обратитесь к руководству по настройкам Общих параметров, чтобы настроить вкладку Общих настроек.

Исходный материал

Перейдите на вкладку "Источник" , чтобы настроить источник действия копирования. См. следующее содержимое для подробной конфигурации.

Снимок экрана: вкладка источника и список свойств.

Требуются следующие свойства:

  • Подключение. Выберите подключение Azure Cosmos DB для MongoDB из списка подключений. Если подключение отсутствует, создайте новое подключение Azure Cosmos DB для MongoDB, выбрав "Дополнительно " в нижней части списка подключений.
  • База данных: выберите базу данных из раскрывающегося списка.
  • Имя коллекции: укажите имя коллекции Azure Cosmos DB. Вы можете выбрать коллекцию из раскрывающегося списка.
  • Версия: указанная версия. Рекомендуется обновить до последней версии, чтобы воспользоваться новыми улучшениями. Чтобы узнать разницу между различными версиями, перейдите в этот раздел.

В разделе "Дополнительно" можно указать следующие поля:

  • Фильтр. Задает фильтр выбора с помощью операторов запросов. Чтобы вернуть все документы в коллекции, опустите этот параметр или передайте пустой документ ({}). Дополнительные сведения о запросе Azure Cosmos DB для MongoDB см. в этих руководствах по запросу.
  • Методы курсора: выберите +Создать , чтобы указать способ выполнения базового запроса. Способы выполнения запроса:
    • проект. Указывает поля, возвращаемые в документах для проекции. Чтобы вернуть все поля в соответствующих документах, опустите этот параметр.
    • сортировка: указывает порядок, в котором запрос возвращает соответствующие документы. Дополнительные сведения см. в cursor.sort().
    • ограничение. Указывает максимальное количество документов, возвращаемых сервером. Дополнительные сведения см. в cursor.limit( ).
    • skip: указывает количество документов, которые нужно пропустить и откуда MongoDB начинает возвращать результаты. Дополнительные сведения см. в cursor.skip( ).
  • Размер пакета: указывает количество документов, возвращаемых в каждом пакете ответа из экземпляра MongoDB. В большинстве случаев изменение размера пакета не повлияет на пользователя или приложение. Azure Cosmos DB ограничивает размер каждого пакета не может превышать 40 МБ, что является суммой размера пакета документов, поэтому уменьшите это значение, если размер документа велик. Значение по умолчанию — 100.
  • Дополнительные столбцы: добавление дополнительных столбцов данных для хранения относительного пути или статического значения исходных файлов. Выражение поддерживается для последнего.

Место назначения

Перейдите на вкладку "Назначение" , чтобы настроить назначение действия копирования. См. следующее содержимое для подробной конфигурации.

Снимок экрана: вкладка назначения и список свойств.

Требуются следующие свойства:

  • Подключение. Выберите подключение Azure Cosmos DB для MongoDB из списка подключений. Если подключение отсутствует, создайте новое подключение Azure Cosmos DB для MongoDB, выбрав "Дополнительно " в нижней части списка подключений.
  • База данных: выберите базу данных из раскрывающегося списка.
  • Имя коллекции: укажите имя коллекции Azure Cosmos DB. Вы можете выбрать коллекцию из раскрывающегося списка.

В разделе "Дополнительно" можно указать следующие поля:

  • Поведение записи. Описывает запись данных в Azure Cosmos DB для MongoDB. Допустимые значения: Insert и Upsert.

    Поведение Upsert заключается в замене документа, если документ уже _id существует; в противном случае вставьте документ.

    Замечание

    Служба автоматически создает _id документ, если _id он не указан либо в исходном документе, либо по сопоставлению столбцов. Это означает, что для правильной работы Upsert документ имеет идентификатор.

  • Время ожидания пакетной операции записи: укажите время ожидания завершения операции вставки пакета до истечения времени ожидания. Допустимое значение — это интервал времени, а значение по умолчанию — 00:30:00 (30 минут).

  • Запись размера пакета: это свойство управляет размером документов для записи в каждом пакете. Вы можете попытаться увеличить значение, чтобы повысить производительность и уменьшить значение, если размер документа велик. Значение по умолчанию — 10 000.

Сопоставление

Сведения о настройке вкладки "Сопоставление " см. в разделе "Настройка сопоставлений" на вкладке "Сопоставление". Сопоставление не поддерживается, если исходные и целевые данные являются иерархическими данными.

Сопоставление типов данных для Azure Cosmos DB для MongoDB

При копировании данных из Azure Cosmos DB для MongoDB следующие сопоставления используются из типов данных Azure Cosmos DB для MongoDB для промежуточных типов данных, используемых службой.

Тип данных Azure Cosmos DB для MongoDB Тип данных промежуточной службы (для версии 1.1) Тип данных промежуточной службы (для версии 1.0)
Date DateTime Int64
ObjectId String String
Десятичная 128 String String
Метка времени Самые значительные 32 бита —> DateTime
Наименее значимые 32 бита -> Int64
Самые значительные 32 бита -> Int64
Наименее значимые 32 бита -> Int64
String String String
Double Double Double
Int32 Int64 Int64
Int64 Int64 Int64
Boolean Boolean Boolean
Null Null Null
JavaScript String String
Регулярное выражение String String
Минимальный ключ String Int64
Максимальный ключ String Int64
Binary GUID (если подтип имеет значение "04" )
String
String

Settings

Для настройки вкладки "Параметры" перейдите к разделу "Настройка других параметров" на вкладке "Параметры".

Различия между версиями Azure Cosmos DB для MongoDB

В таблице ниже показаны различия функций между различными версиями.

Версия 1.1 Версия 1.0
Следующие сопоставления используются из типов данных Azure Cosmos DB для MongoDB для промежуточных типов данных службы.

Дата —> DateTime
TimeStamp (наиболее значимые 32 бита) —> DateTime
Min key —> String
Максимальный ключ —> Строка
Binary —> GUID (если подтип имеет значение "04") / String
Следующие сопоставления используются из типов данных Azure Cosmos DB для MongoDB для промежуточных типов данных службы.

Дата —> Int64
Метка времени (наиболее значимые 32 бита) —> Int64
Min key —> Int64
Максимальный ключ —> Int64
Двоичное —> строка

Сводка таблицы

В следующей таблице содержатся дополнительные сведения о действии копирования в Azure Cosmos DB для MongoDB.

Исходная информация

Имя Description Ценность Обязательно Свойство скрипта JSON
Соединение Подключение к исходному хранилищу данных. < подключение Azure Cosmos DB для MongoDB > Да connection
База данных База данных, используемая в качестве источника. < база данных > Да база данных
Имя коллекции Имя коллекции Azure Cosmos DB. < коллекция > Да коллекция
Версия Версия, которую вы указали. • 1.1
• 1.0
Да Версия:
• 1.1
• 1.0
Фильтр Фильтр выбора с помощью операторов запросов. Чтобы вернуть все документы в коллекции, опустите этот параметр или передайте пустой документ ({}). < фильтр выбора > нет фильтр
Методы курсора Способ выполнения базового запроса. проект
сортировка
ограничение
пропустить
нет cursorMethods:
•проект
•сортировать
•предел
•скип
Размер пакета Количество документов, возвращаемых в каждом пакете ответа из экземпляра MongoDB. В большинстве случаев изменение размера пакета не повлияет на пользователя или приложение. Azure Cosmos DB ограничивает размер каждого пакета не может превышать 40 МБ, что является суммой размера пакета документов, поэтому уменьшите это значение, если размер документа велик. < размер пакета записи >
(значение по умолчанию — 100)
нет РазмерПакета
Дополнительные столбцы Добавьте дополнительные столбцы данных для хранения относительного пути или статического значения исходных файлов. Выражение поддерживается для последнего. • Имя
•Ценность
нет additionalColumns:
•имя
•ценность

Сведения о назначении

Имя Description Ценность Обязательно Свойство скрипта JSON
Соединение Подключение к целевому хранилищу данных. < подключение Azure Cosmos DB для MongoDB > Да connection
База данных База данных, используемая в качестве назначения. < база данных > Да база данных
Имя коллекции Имя коллекции Azure Cosmos DB. < коллекция > Да коллекция
Поведение записи Описывает запись данных в Azure Cosmos DB для MongoDB. Допустимые значения: Insert и Upsert.

Поведение Upsert заключается в замене документа, если документ уже _id существует; в противном случае вставьте документ.

Примечание. Служба автоматически создает _id документ для документа, если _id он не указан либо в исходном документе, либо по сопоставлению столбцов. Это означает, что для правильной работы Upsert документ имеет идентификатор.
Вставка (по умолчанию)
Upsert
нет writeBehavior:
•вставка
• добавление или обновление записи
Время ожидания пакетной службы Время ожидания завершения операции пакетной вставки до истечения времени ожидания. timespan
(значение по умолчанию — 00:30:00 – 30 минут)
нет writeBatchTimeout
Размер пакета записи Определяет размер документов для записи в каждом пакете. Вы можете попытаться увеличить это значение, чтобы повысить производительность и уменьшить значение, если размер документа большой. < размер пакета записи >
(значение по умолчанию — 10 000)
нет writeBatchSize (размер батча записи)