Поделиться через


Мониторинг нескольких систем Azure, размещенных локально, с помощью Insights

Область применения: Azure Local 2311.2 и более поздних версий

В этой статье объясняется, как использовать Аналитику для мониторинга нескольких локальных систем Azure. Сведения об одной локальной системе Azure см. в статье "Мониторинг единой локальной системы Azure" с помощью Insights.

Сведения о преимуществах, предварительных требованиях и способах включения аналитики для каждой локальной системы Azure см. в разделе "Преимущества", "Предварительные требования" и "Включить аналитику".

Чтобы отслеживать несколько локальных систем Azure с помощью Insights, необходимо включить Аналитику для каждой системы по отдельности. Вместо этого вы можете включить инсайты в больших масштабах с помощью политик Azure. Дополнительные сведения см. в статье Активация Insights для локального Azure в масштабе с использованием политик Azure.

Просмотрите видео с кратким введением:

Просмотр сведений о работоспособности, производительности и использовании

Инструмент Insights хранит свои данные в рабочей области Log Analytics, что позволяет обеспечить эффективное агрегирование и фильтрацию, а также анализировать тенденции данных с течением времени. Для Insights нет прямых затрат. Пользователям выставляются счета на основе объема приема данных и параметров хранения данных рабочей области Log Analytics.

Вы можете получить доступ к Инсайтам из Azure Monitor>Инсайты>Azure Local. Используйте следующие вкладки для переключения между представлениями: добавление в мониторинг, работоспособности кластера, узлов, виртуальных машин и хранилища.

Фильтрация результатов

Визуализация может быть отфильтрована по всем подпискам. Результаты можно отфильтровать на основе следующих раскрывающихся меню:

  • Диапазон времени: этот фильтр позволяет выбрать диапазон для представления тренда. Значение по умолчанию — Последние 24 часа.
  • Подписки. Показывает подписки, зарегистрированные в локальных кластерах Azure. В этом фильтре можно выбрать несколько подписок.
  • Кластеры: перечисляет зарегистрированные локальные кластеры Azure, имеющие возможности журналов и мониторинга, включенные в выбранном диапазоне времени. В этом фильтре можно выбрать несколько кластеров.
  • Группы ресурсов. Этот фильтр позволяет выбрать все кластеры в группе ресурсов.

Добавление в мониторинг

Эта функция содержит сведения о кластерах, которые не отслеживаются пользователем. Чтобы начать мониторинг кластера, выберите его, чтобы открыть этот кластер, а затем выберите Возможности и аналитика". Если кластер не отображается, убедитесь, что он недавно подключен к Azure.

Снимок экрана: выбор кластера для мониторинга.

Столбец Описание Пример
Кластер Имя кластера. 27cls1
Состояние подключения Azure Состояние локального ресурса Azure. Подключено
Версия ОС Операционная система устанавливается на узле. 10.0.20348.10131

По умолчанию в представлении сетки отображаются первые 250 строк. Можно задать значение, изменив строки сетки, как показано на следующем рисунке:

Снимок экрана: экран для задания значений сетки.

Сведения в Excel можно экспортировать, выбрав "Экспорт в Excel ", как показано на следующем рисунке:

Снимок экрана: ссылка для экспорта в Excel.

Excel предоставит следующее состояние подключения Azure:

  • 0. Не зарегистрировано
  • 1. Отключено
  • 2. Не недавно
  • 3. Подключено

Работоспособность кластера

Это представление содержит обзор работоспособности кластеров.

Снимок экрана: общие сведения о работоспособности кластера.

Столбец Описание Пример
Кластер Имя кластера. 27cls1
Последнее обновление Метка времени, когда узел был в последний раз обновлён. 4.9.2022, 12:15:42 после полудня
Состояние Предоставляет состояние работоспособности узлов в кластере. Это может быть здоровое, предупреждающее, критическое или другое. Здоровый
Ресурс, вызывающий сбой Описание того, какой ресурс вызвал ошибку. Сервер, StoragePool, подсистема
Всего узлов Количество узлов в кластере. 4

Если кластер отсутствует или отображает состояние "Другой", перейдите в рабочую область Log Analytics, используемую для кластера, и убедитесь, что конфигурация агента записывает данные из журнала работоспособности или эксплуатации Microsoft-Windows. Также убедитесь, что кластеры недавно подключались к Azure, и проверьте, что они не исключены из этого отчета.

Узлы

В этом представлении представлен обзор работоспособности узла и производительности и использования выбранных кластеров. Это представление создается с помощью идентификатора события сервера 3000 канала журнала событий Microsoft-Windows-SDDC-Management/Operations Windows. Каждая строка может быть расширена, чтобы увидеть состояние работоспособности узла. Вы можете взаимодействовать с кластером и ресурсом узла, чтобы перейти на соответствующую страницу ресурсов.

Снимок экрана: состояние работоспособности узлов.

Виртуальные машины

Это представление предоставляет состояние всех виртуальных машин в выбранном кластере. Представление создается с помощью идентификатора события виртуальной машины 3003 канала журнала событий Microsoft-Windows-SDDC-Management/Operational Windows Event Log. Каждая строка может быть расширена для просмотра распределения виртуальных машин между узлами в кластере. Вы можете взаимодействовать с ресурсом кластера и узла, чтобы перейти на соответствующую страницу ресурсов.

Снимок экрана: работоспособность виртуальных машин.

Метрика Описание Пример
Узел кластера > Имя кластера. При расширении отображаются узлы в кластере. Образец-VM-1
Последнее обновление Отметка даты и времени последнего обновления узла. 09.04.2022, 12:24:02
Общее число виртуальных машин Количество виртуальных машин в узле в кластере. 1 из 2 выполняемых
Бег Количество виртуальных машин, работающих в узле в кластере. 2
Остановлено Количество виртуальных машин, остановленных в узле в кластере. 3
Неудачно Количество виртуальных машин, вышедших из строя в узле кластера. 2
Другие Если виртуальная машина находится в одном из следующих состояний (неизвестно, запуск, создание моментального снимка, сохранение, остановка, приостановка, возобновление, приостановлено, приостановлено), она считается как находящаяся в другом состоянии. 2

Хранилище

В этом представлении показана работоспособность томов, их использование и производительность в отслеживаемых кластерах. Разверните кластер, чтобы просмотреть состояние отдельных томов. Это представление создается с помощью идентификатора события тома 3002 канала журнала событий Microsoft-Windows-SDDC-Management/Operational Windows. Плитки в верхней части содержат обзор состояния хранилища.

Снимок экрана, показывающий состояние томов хранилища.

Метрика Описание Пример
Том кластера > Имя кластера. При расширении отображаются тома кластера. AltaylCluster1 > ClusterPerformanceHistory
Последнее обновление Дата и время последнего обновления хранилища. 14.04.2022, 14:58:55
Состояние тома Состояние тома. Это может быть здоровое, предупреждающее, критическое или другое. Здоровый
Размер Общая емкость устройства в байтах за отчетный период. 25 млрд
Использование Процент доступной емкости в течение отчетного периода. 23,54%
Иопс Количество операций ввода-вывода в секунду. 45/с
Тенденция Тренд IOPS.
Пропускная способность Количество байтов в секунду, обрабатываемых Шлюзом приложений 5Б/с
Динамика (B/s) Тенденция пропускной способности.
Среднее время задержки Задержка — это среднее время, необходимое для завершения запроса ввода-вывода. 334 мкс

Настройка параметров аналитики

Так как пользовательский интерфейс основан на шаблонах книг Azure Monitor, пользователи могут изменять визуализации и запросы и сохранять их в виде настраиваемой книги.

Если вы используете визуализацию из центра Insights > Azure Monitor > Azure Local, выберите Настроить > Редактировать > Сохранить как, чтобы сохранить копию вашей измененной версии в настраиваемую рабочую книгу.

Рабочие книги сохраняются в группе ресурсов. Все пользователи, имеющие доступ к группе ресурсов, могут получить доступ к настраиваемой рабочей тетради.

Большинство запросов записываются с помощью язык запросов Kusto (KQL). Некоторые запросы записываются с помощью запроса Resource Graph. Дополнительные сведения см. в следующих статьях:

Поддержка

Чтобы открыть запрос в службу поддержки для Insights, используйте службу Insights для локальной службы Azure в разделе "Мониторинг и управление".

Канал журнала событий

Аналитические представления и представления мониторинга основаны на канале журнала событий Windows-SDDC-Management или Operations Windows. Если мониторинг включен, данные из этого канала сохраняются в рабочей области Log Analytics.

Просмотр и изменение интервала дамп-кэша

Интервал по умолчанию для дампа кэша имеет значение 3600 секунд (1 час).

Используйте следующие командлеты PowerShell для просмотра значения интервала дампа кэша:

Get-ClusterResource "sddc management" | Get-ClusterParameter

Используйте следующие командлеты, чтобы настроить частоту дампа кэша. Если задано значение 0, он остановит публикацию событий:

Get-ClusterResource "sddc management" | Set-ClusterParameter -Name CacheDumpIntervalInSeconds -Value <value in seconds>

События Windows в канале журнала событий

Этот канал включает пять событий. Каждое событие имеет имя кластера и идентификатор Azure Resource Manager в качестве EventData.

Идентификатор события Тип события
3000 Сервер
3001 Диск
3002 Громкость
3003 Виртуальная машина
3004 Кластер

Значение столбца RenderedDescription для серверного события 3000

{
   "m_servers":[
      {
         "m_statusCategory":"Integer",
         "m_status":[
            "Integer",
            "…"
         ],
         "m_id":"String",
         "m_name":"String",
         "m_totalPhysicalMemoryInBytes":"Integer",
         "m_usedPhysicalMemoryInBytes":"Integer",
         "m_totalProcessorsUsedPercentage":"Integer",
         "m_totalClockSpeedInMHz":"Integer",
         "m_uptimeInSeconds":"Integer",
         "m_InboundNetworkUsage":"Double (Bits/sec)",
         "m_OutboundNetworkUsage":"Double (Bits/sec)",
         "m_InboundRdmaUsage":"Double (Bits/sec)",
         "m_OutboundRdmaUsage":"Double (Bits/sec)",
         "m_site":"String",
         "m_location":"String",
         "m_vm":{
            "m_totalVmsUnknown":"Integer",
            "m_totalVmsRunning":"Integer",
            "m_totalVmsStopped":"Integer",
            "m_totalVmsFailed":"Integer",
            "m_totalVmsPaused":"Integer",
            "m_totalVmsSuspended":"Integer",
            "m_totalVmsStarting":"Integer",
            "m_totalVmsSnapshotting":"Integer",
            "m_totalVmsSaving":"Integer",
            "m_totalVmsStopping":"Integer",
            "m_totalVmsPausing":"Integer",
            "m_totalVmsResuming":"Integer"
         },
         "m_osVersion":"String",
         "m_buildNumber":"String",
         "m_totalPhysicalProcessors":"Integer",
         "m_totalLogicalProcessors":"Integer"
      },
      "…"
   ],
   "m_alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }
} 

Большинство переменных являются самоочевидными из этой информации JSON. Однако в следующей таблице перечислены несколько переменных, которые немного сложнее понять.

Переменная Описание
m_серверы Массив узлов.
м_категорияСтатуса Состояние работоспособности узла.
m_статус Состояние узла. Это массив, который может содержать одно или два значения. Первое значение является обязательным (0–4). Второе значение является необязательным (5-9).

Значения переменной m_statusCategory приведены следующим образом:

Значение Значение
0 Здоровый
1 Предупреждение
2 Нездоровый
255 Другие

Значения для переменной m_status приведены следующим образом:

Значение Значение
0 Вверх
1 вниз
2 На техническом обслуживании
3 Присоединение
4 Обычная
5 Изолированный
6 Помещено в карантин
7 Осушение
8 Очистка завершена
9 Сбой дренажа
0xffff Неизвестно

Значение столбца RenderedDescription для события диска номер 3001

Событие дисковое устройство 3001

{
    "m_drives":[
        {
            "m_uniqueId":"String",
            "m_model":"String",
            "m_type":"Integer",
            "m_canPool":"Boolean",
            "m_sizeInBytes":"Integer",
            "m_sizeUsedInBytes":"Integer",
            "m_alerts":{
                "m_totalUnknown":"Integer",
                "m_totalHealthy":"Integer",
                "m_totalWarning":"Integer",
                "m_totalCritical":"Integer"
            }
        },
        "…"
    ],
    "m_correlationId":"String",
    "m_isLastElement":"Boolean"
}

Значение столбца RenderedDescription для события объема с номером 3002

Событие тома 3002

{
   "VolumeList":[
      {
         "m_Id":"String",
         "m_Label":"String",
         "m_Path":"String",
         "m_StatusCategory":"Integer",
         "m_Status":[
            "Integer",
            "…"
         ],
         "m_Size":"Integer (Bytes)",
         "m_SizeUsed":"Integer (Bytes)",
         "m_TotalIops":"Double (Count/second)",
         "m_TotalThroughput":"Double (Bytes/Second)",
         "m_AverageLatency":"Double (Seconds)",
         "m_Resiliency":"Integer",
         "m_IsDedupEnabled":"Boolean",
         "m_FileSystem":"String"
      },
      "…"
   ],
   "m_Alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }
} 

Большинство переменных являются понятными из приведённых выше данных JSON. Однако в таблице ниже перечислены несколько переменных, которые немного сложнее понять.

Переменная Описание
Список томов Массив томов.
КатегорияСтатуса Состояние здоровья тома.
m_Статус Состояние тома. Это массив, который может содержать одно или два значения. Первое значение является обязательным (0–4). Второе значение является необязательным (5-9).

Значения переменной m_statusCategory приведены следующим образом:

Значение Значение
0 Здоровый
1 Предупреждение
2 Нездоровый
255 Другие

Значения для переменной m_status приведены следующим образом:

Значение Значение
0 Неизвестно
1 Другие
2 ОК
3 Требуется восстановление
4 Подверженный стрессу
5 Прогнозируемый сбой
6 Ошибка
7 Неустранимая ошибка
8 Запуск
9 Остановка
10 Остановлено
11 В эксплуатации
12 Нет контакта
13 (тринадцать) Связь потеряна
14 Прервано
15 Бездействующий
16 Поддержка сущности в ошибке
17 Завершено
18 Режим питания
19 Перемещение
0xD002 вниз
0xD003 Требуется повторная синхронизация

Значение столбца RenderedDescription для события виртуальной машины 3003

Событие виртуальной машины 3003

{
   "m_totalVmsUnknown":"Integer",
   "m_totalVmsRunning":"Integer",
   "m_totalVmsStopped":"Integer",
   "m_totalVmsFailed":"Integer",
   "m_totalVmsPaused":"Integer",
   "m_totalVmsSuspended":"Integer",
   "m_totalVmsStarting":"Integer",
   "m_totalVmsSnapshotting":"Integer",
   "m_totalVmsSaving":"Integer",
   "m_totalVmsStopping":"Integer",
   "m_totalVmsPausing":"Integer",
   "m_totalVmsResuming":"Integer",
   "m_alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }
}

Значение столбца RenderedDescription для события кластера 3004

Событие кластера 3004

{
   "m_cpuUsage":"Double (%)",
   "m_totalVolumeIops":"Double",
   "m_averageVolumeLatency":"Double (Seconds)",
   "m_totalVolumeThroughput":"Double (Bytes/Second)",
   "m_totalVolumeSizeInBytes":"Integer",
   "m_usedVolumeSizeInBytes":"Integer",
   "m_totalMemoryInBytes":"Integer",
   "m_usedMemoryInBytes":"Integer",
   "m_isStretch":"Boolean",
   "m_QuorumType":"String",
   "m_QuorumMode":"String",
   "m_QuorumState":"String",
   "m_alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }

Дополнительные сведения о собранных данных см. в разделе Ошибки службы состояния системы.

Следующие шаги

Для получения дополнительной информации см.: