Прочитать на английском

Поделиться через


Обработка и маршрутизация данных с потоками данных

Потоки данных позволяют подключать различные источники данных и выполнять операции с данными, упрощая настройку путей данных для перемещения, преобразования и обогащения данных. Компонент потока данных является частью операций Интернета вещей Azure, которая развертывается в качестве расширения Azure Arc. Конфигурация потока данных выполняется с помощью пользовательских определений ресурсов Kubernetes (CRD).

Конфигурации можно написать для различных вариантов использования, например:

  • Преобразование данных и отправка их обратно в MQTT
  • Преобразование данных и отправка их в облако
  • Отправка данных в облако или edge без преобразования

Потоки данных не ограничиваются регионом, в котором развертывается экземпляр операций Интернета вещей. Потоки данных можно использовать для отправки данных в облачные конечные точки в разных регионах.

Ключевые функции

Ниже приведены основные функции потоков данных.

Обработка и маршрутизация данных

Потоки данных обеспечивают прием, обработку и маршрутизацию сообщений в указанные приемники. Можно указать:

  • Источники: откуда отправляются сообщения
  • Назначения: где сообщения стекаются в
  • Преобразования (необязательно): настройка операций обработки данных

Возможности преобразования

Преобразования можно применять к данным на этапе обработки для выполнения различных операций. Эти операции могут включать:

  • Вычисление новых свойств: на основе существующих свойств в сообщении
  • Переименование свойств: стандартизация или уточнение данных
  • Преобразование единиц: преобразование значений в разные единицы измерения
  • Стандартизация значений: масштабирование значений свойств в определяемый пользователем диапазон
  • Контекстуализация данных: добавление ссылочных данных в сообщения для обогащения и анализа вождения

Настройка и развертывание

Конфигурация указана с помощью crD Kubernetes. На основе этой конфигурации оператор потока данных создает экземпляры потока данных, чтобы обеспечить высокий уровень доступности и надежности.

Льготы

  • Упрощенная настройка: простое подключение источников данных и назначений.
  • Гибкие преобразования. Выполнение широких операций с данными.
  • Масштабируемая конфигурация. Используйте CRD Kubernetes для масштабируемых и управляемых конфигураций.
  • Высокий уровень доступности: собственный ресурс Kubernetes обеспечивает надежность.

С помощью потоков данных можно эффективно управлять путями данных. Вы можете убедиться, что данные точно отправляются, преобразуются и обогащены в соответствии с вашими операционными потребностями.

Реестр схем

Реестр схем, предоставляемый реестром устройств Azure, — это синхронизированный репозиторий в облаке и на границе. Реестр схем хранит определения сообщений, поступающих из пограничных ресурсов, а затем предоставляет API для доступа к этим схемам на границе. Соединители southbound, такие как соединитель для OPC UA, могут создавать схемы сообщений и добавлять их в реестр схем или клиенты могут отправлять схемы в веб-интерфейс взаимодействия с операциями.

Потоки данных используют схемы сообщений для преобразования сообщения в формат, ожидаемый конечной точкой назначения.

Дополнительные сведения см. в разделе "Общие сведения о схемах сообщений".

Локальное хранилище сообщений брокера MQTT на конечной точке

При использовании локального брокера MQTT в качестве исходной конечной точки в потоке данных сообщения хранятся во время потери подключения между потоком данных и конечной точкой назначения. В качестве примера сценария предполагается, что вы создаете поток данных с помощью локального брокера MQTT по умолчанию в качестве исходной конечной точки и Центров событий Azure в качестве конечной точки назначения. Если подключение между потоком данных и Центрами событий Azure потеряно, сообщения хранятся в очереди сообщений подписчика брокера MQTT. При восстановлении подключения поток данных отправляет сообщения в очереди сообщений подписчика в Центры событий Azure.

Локальная очередь сообщений брокера MQTT хранится в памяти по умолчанию. Брокер MQTT можно настроить для хранения сообщений на диске с помощью конфигурации буфера сообщений с поддержкой диска. Дополнительные сведения о конфигурации брокера MQTT см. в разделе "Настройка параметров брокера" для обеспечения высокой доступности, масштабирования и использования памяти. Дополнительные сведения о буфере сообщений с поддержкой диска см. в разделе "Настройка поведения буфера сообщений с поддержкой диска".