Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
В этой статье показано, как добавить источник отслеживания измененных данных MongoDB (CDC) в поток событий.
Соединитель CDC MongoDB для Eventstream позволяет передавать события отслеживания изменений (CDC) из MongoDB в Fabric Eventstream. Он поддерживает несколько типов развертывания MongoDB, включая локальные, размещенные в облаке, и MongoDB Atlas, что обеспечивает широкий спектр сценариев CDC. С помощью этого соединителя можно записывать изменения базы данных в режиме реального времени и передавать их непосредственно в поток событий для немедленной обработки и аналитики.
Предпосылки
- Рабочая область в режиме Fabric вместимости или пробной лицензии с разрешениями Contributor или более высокими разрешениями.
- Кластер MongoDB, доступный из IP-адреса клиента. Если он находится в защищенной сети, подключитесь к нему с помощью внедрения виртуальной сети соединителя Eventstream.
- Включение отслеживания изменений данных (CDC) для коллекций, которые требуется отслеживать.
- Поток событий в Fabric. Если у вас его нет, создайте поток событий.
Создайте экземпляр MongoDB
В этом примере используется MongoDB Atlas, управляемая служба MongoDB в MongoDB Cloud.
Чтобы записать изменения, необходимо включить запись измененных данных (CDC) для целевых коллекций.
Выполните следующую команду в оболочке MongoDB, чтобы включить CDC для коллекции:
db.runCommand({
collMod: "<collectionName>",
changeStreamPreAndPostImages: { enabled: true }
});
Замечание
Для выполнения этой команды требуется пользователь с atlasAdmin ролью, которая включает действие collMod. Если у вас нет этих разрешений, попросите коллегу с ролью atlasAdmin включить сбор изменений данных (Change Data Capture, CDC) для целевых коллекций перед фиксацией изменений в вашем потоке событий.
Необходимо также создать или использовать существующего пользователя MongoDB с ролью read (или выше) в целевой базе данных. В MongoDB Atlas в MongoDB Cloud перейдите в службу "Доступ к базе данных" , чтобы проверить роль пользователя.
В MongoDB Atlas в MongoDB Cloud перейдите к сетевому доступу и добавьте IP-адрес клиента в список доступа к IP-адресам.
Добавление MongoDB (CDC) в качестве источника
Если вы еще не добавили источник в поток событий, выберите плитку "Подключить источники данных ". Вы также можете выбрать Добавить источник>Подключить источники данных на ленте.
Если вы добавляете источник в уже опубликованный поток событий, переключитесь в режим редактирования . На ленте выберите Добавить источник>Подключить источники данных.
На странице "Выбор источника данных" найдите и выберите "Подключиться" на плитке MongoDB (CDC).
Настройка и подключение к MongoDB (CDC)
Выберите тип экземпляра MongoDB: MongoDB Atlas или MongoDB (самоуправляемый).
Подключение:
Если выбрать MongoDB Atlas:
На экране "Подключение" в разделе "Подключение" выберите "Создать подключение".
Введите следующие параметры подключения и учетные данные подключения:
Server: connection string для кластера Atlas, например
cluster0.example.mongodb.net.Кластер. Это поле является необязательным. Имя кластера уже является частью сервера, поэтому вы можете оставить это пустым.
Имя подключения: автоматически создано или введите новое имя для этого подключения.
Имя пользователя и пароль: учетные данные для пользователя с ролью не ниже чем
read. Убедитесь, что пользователь имеет доступ к целевой базе данных и коллекциям.
Если выбрать MongoDB (самоуправляемый):
На экране "Подключение" в разделе "Подключение" выберите "Создать подключение", чтобы создать облачное подключение.
Введите следующие параметры подключения и учетные данные подключения:
Server: connection string для локально управляемого сервера MongoDB, например
mongodb0.example.com:27017.Имя подключения: автоматически создано или введите новое имя для этого подключения.
Имя пользователя и пароль. Укажите пользователя с разрешениями на чтение или более высокие разрешения для целевой базы данных и коллекций.
Введите следующие сведения, чтобы настроить источник данных CDC MongoDB, а затем нажмите кнопку "Далее".
- Базы данных: выберите все (по умолчанию) или введите имена баз данных. При выборе последнего укажите необязательный список разделенных запятыми регулярных выражений, которые соответствуют именам баз данных для отслеживания.
-
Коллекции: выберите все (по умолчанию) или введите имена коллекций. При выборе последнего укажите разделенный запятыми список регулярных выражений, которые соответствуют полным пространствам имен (например
dbName.collectionName) коллекций MongoDB для отслеживания.
Вы можете развернуть Дополнительные настройки для доступа к расширенным параметрам конфигурации источника CDC MongoDB.
-
Режим моментального снимка: доступны следующие параметры:
- initial (default): указывает, что коннектор считывает моментальный снимок, когда смещение отсутствует или если поток oplog/change больше не содержит предыдущего смещения.
- initial_only: Коннектор выполняет моментальный снимок базы данных. После завершения моментального снимка соединитель останавливается и не передает записи событий для последующих изменений базы данных.
- no_data. Соединитель записывает структуру всех соответствующих таблиц, но не создает события READ для представления набора данных в точке запуска соединителя.
Вы также можете изменить имя источника, нажав кнопку "Карандаш " для имени источника в разделе сведений о потоке справа.
-
Режим моментального снимка: доступны следующие параметры:
Сведения о потоке или источнике
На странице "Подключение" выполните одно из этих действий на основе того, используете ли вы поток событий или концентратор Real-Time.
Eventstream:
В области сведений о источнике справа выполните следующие действия:
Чтобы изменить имя источника, нажмите кнопку Карандаш.
Обратите внимание, что имя потока событий и имя Stream доступны только для чтения.
центрReal-Time:
В разделе сведений о потоке справа выполните следующие действия.
Выберите рабочую область Fabric где нужно создать поток событий.
Для имени eventstream нажмите кнопку «Карандаш» и введите название для eventstream.
Значение имени потока автоматически создается шляхом добавления -stream к имени eventstream. Этот поток отображается на странице "Все потоки данных " концентратора в режиме реального времени, когда мастер завершит работу.
Нажмите кнопку "Далее" в нижней части страницы "Настройка ".
Проверка и подключение
На экране "Обзор и подключение" просмотрите сводку и выберите "Добавить (Eventstream) или "Connect (Real-Time hub).
Просмотр обновленного потока событий
Вы увидите источник MongoDB (CDC), добавленный в поток событий в режиме редактирования.
Вы видите поток событий в режиме реального времени. Нажмите кнопку "Изменить " на ленте, чтобы вернуться в режим редактирования, чтобы обновить поток событий.
Limitation
- Источник CDC MongoDB в настоящее время не поддерживает функции CI/CD, включая интеграцию Git и конвейер развертывания. Попытка экспортировать или импортировать элемент Eventstream с этим источником в репозиторий Git может привести к ошибкам.
Связанный контент
Другие соединители:
- Потоки данных Amazon Kinesis
- Azure Cosmos DB
- Центры событий Azure
- Центр Интернета вещей Azure
- Фиксирование изменений данных в базе данных Azure SQL (CDC)
- Confluent Kafka
- Пользовательская конечная точка
- Google Cloud Pub/Sub
- База данных PostgreSQL CDC
- Примеры данных
- события Azure Blob Storage
- Fabric событие рабочей области