Поделиться через


Наблюдаемость Оператора Azure Nexus

Платформа отслеживания состояния Nexus Operator предоставляет данные о работе ваших локальных систем. Платформа поддерживает ведение журнала, мониторинг и оповещение (LMA), аналитику и визуализацию операционных (платформ и рабочих нагрузок) данных и метрик.

Снимок экрана: платформа ведения журнала, мониторинга и оповещений (LMA) оператора Nexus.

Рис.: Оператор Nexus для регистрации, мониторинга и оповещения (LMA) Framework

Основные моменты платформы наблюдения Operator Nexus:

  • Централизованный сбор данных: решение для наблюдаемости Оператора Nexus основано на сборе всех данных в центральном месте. Здесь можно наблюдать за данными мониторинга всех локальных экземпляров.
  • Хорошо настроенные и проверенные инструменты: решение основывается на Azure Monitor, который собирает, анализирует и действует на данные телеметрии из ваших облачных и локальных экземпляров.
  • Легко учиться и использовать: Решение делает процесс анализа и отладки проблем проще, предоставляя возможность поиска данных как внутри, так и по всем вашим облачным и локальным экземплярам.
  • Средства визуализации: вы создаете настраиваемые панели мониторинга и книги в соответствии с вашими потребностями.
  • Встроенное средство генерации оповещений: вы создаете оповещения на основе пользовательских пороговых значений. Вы можете создавать и повторно использовать шаблоны оповещений во всех экземплярах.

Эта статья поможет понять платформу наблюдаемости Оператора Nexus, состоящую из стека компонентов:

  • Azure Monitor собирает и агрегирует данные ведения журнала из компонентов Operator Nexus
  • Рабочая область Azure Log Analytics (LAW) собирает и агрегирует данные ведения журнала из нескольких подписок и клиентов Azure.
  • Анализ, визуализация и оповещение выполняются для агрегированных данных журнала.

Мониторинг платформы

Оператор Nexus позволяет просматривать производительность развертываний, состоящих из ресурсов инфраструктуры. Необходимо собирать и анализировать журналы и метрики из этих ресурсов платформы. Вы получаете ценные аналитические сведения из централизованной коллекции и агрегирования данных из всех источников по сравнению с не агрегированными данными.

Эти журналы и метрики используются для наблюдения за состоянием платформы. Вы можете увидеть производительность и проанализировать, что не так. Вы можете проанализировать причину ситуации. Визуализация помогает настроить необходимые оповещения и в каких условиях. Например, можно настроить оповещения, которые будут генерироваться при ненормальной работе ресурсов или при достижении пороговых значений. Собранные журналы и аналитику можно использовать для отладки любых проблем в среде.

Мониторинг данных

Наблюдаемость Оператора Nexus позволяет собирать те же данные, что и другие ресурсы Azure. Данные, собранные из каждого экземпляра, можно просмотреть в вашей LAW.

Здесь вы можете узнать о мониторинге ресурсов Azure.

Коллекция и маршрутизация

Наблюдаемость Оператора Nexus позволяет собирать данные для каждого ресурса инфраструктуры. Набор компонентов инфраструктуры включает:

  • Сетевая структура, содержащая CEs, TOR, NPB, коммутаторы управления и сервер терминала.
  • Вычисление, включающее серверы без операционной системы.
  • Уровень управления Undercloud (кластер Kubernetes, отвечающий за развертывание и управление жизненным циклом общей платформы).

Сбор данных журнала из этих слоев включен по умолчанию во время создания экземпляра Operator Nexus. Эти собранные журналы направляются в ваше рабочее пространство Log Analytics в Azure Monitor.

Вы также можете собирать данные из уровней клиента, созданных для запуска контейнерных и виртуализированных сетевых функций. Данные журнала, которые можно собирать, включают:

  • Сбор системных журналов из виртуальных машин (используется в качестве рабочих нагрузок для VNFs или CNF).
  • Коллекция журналов из кластеров Kubernetes и приложений, развернутых сверху.

Вам необходимо включить сбор данных журналов из кластеров Kubernetes клиента и виртуальных машин. Чтобы развернуть агенты мониторинга Azure, следуйте шагам. Данные будут собраны в вашем законе Azure.

Хранилище журналов оператора Nexus

Данные в журналах Azure Monitor хранятся в таблицах, каждая из которых имеет собственный набор уникальных свойств.

Все журналы ресурсов в Azure Monitor имеют одинаковые поля, за которыми следует поля для конкретной службы; см. общую схему.

Журналы платформы Operator Nexus хранятся в следующих таблицах:

Таблица Описание
Системный журнал События системного журнала на компьютерах Linux с помощью агента Log Analytics
Учет контейнеров Сведения и текущее состояние каждого контейнера.
Журнал контейнера Строки журнала, собранные из потоков stdout и stderr для контейнеров
ContainerNodeInventory Сведения о узлах, которые служат хостами контейнеров.
InsightMetrics Метрики, собранные с сервера, K8s, контейнеров.
KubeEvents События Kubernetes и их свойства.
KubeMonAgentEvents События, зарегистрированные агентом Kubernetes Azure Monitor для ошибок и предупреждений.
KubeNodeInventory Сведения о узлах, входящих в кластер Kubernetes
KubePodInventory Поды Kubernetes и их свойства
KubePVInventory Постоянные тома Kubernetes и их свойства.
KubeServices Службы Kubernetes и их свойства
Пульс Записи, зарегистрированные агентами Log Analytics один раз в минуту, чтобы сообщить о работоспособности агента

Метрики связи операторов

Таблица InsightMetrics в разделе "Журналы" содержит метрики, собранные с компьютеров с голым железом и подоблачного кластера Kubernetes. Кроме того, можно наблюдать несколько выбранных метрик, собранных из нижнего облака, открыв вкладку "Метрики" в меню Azure Monitor.

Снимок экрана: выбор метрик Azure Monitor.

Рисунок. Выбор метрик Azure Monitor

Воспользуйтесь обозревателем метрик Azure Monitor, чтобы получить подробную информацию о его использовании.

Рабочие тетради

Рабочие книги объединяют текст, запросы журналов, метрики и параметры для анализа данных и для создания нескольких типов разнообразных визуализаций. Вы можете использовать примеры шаблонов рабочей тетради Azure Resource Manager для ведения журнала и мониторинга оператора Nexus, чтобы развернуть рабочие тетради Azure в рамках вашего рабочей области Log Analytics Azure.

Оповещения

Вы можете использовать примеры шаблонов оповещений Azure Resource Manager для правил оповещений Оператора Nexus. Необходимо указать пороговые значения и условия для оповещений. Затем эти шаблоны оповещений можно развернуть в локальной среде.

Оповещения о емкости оборудования

Порог емкости оборудования для устройств установлен на уровне 60%, а пороги ограничения TrafficPolicy заданы на уровне 35%. Все оповещения будут опубликованы с помощью системного журнала.

Рабочая область Log Analytic

Рабочая область Log Analytics (LAW) — это уникальная среда для регистрации данных из Azure Monitor и других служб Azure. Каждая рабочая область имеет собственный репозиторий данных и конфигурацию, но может объединять данные из нескольких служб. Каждая рабочая область состоит из нескольких таблиц данных.

Можно создать единое рабочее пространство для сбора всех соответствующих данных или несколько рабочих областей в зависимости от требований оператора.