Мониторинг нескольких систем Azure, размещенных локально, с помощью Insights

Область применения: гиперконвергентные развертывания локальной среды Azure

В этой статье объясняется, как использовать Аналитику для мониторинга нескольких локальных систем Azure. Сведения об одной локальной системе Azure см. в статье "Мониторинг единой локальной системы Azure" с помощью Insights.

Сведения о преимуществах, предварительных требованиях и способах включения аналитики для каждой локальной системы Azure см. в разделе "Преимущества", "Предварительные требования" и "Включить аналитику".

Чтобы отслеживать несколько локальных систем Azure с помощью Insights, необходимо включить Аналитику для каждой системы по отдельности. Вместо этого вы можете включить инсайты в больших масштабах с помощью политик Azure. Дополнительные сведения см. в статье Активация Insights для локального Azure в масштабе с использованием политик Azure.

Просмотрите видео с кратким введением:

Просмотр сведений о работоспособности, производительности и использовании

Инструмент Insights хранит свои данные в рабочей области Log Analytics, что позволяет обеспечить эффективное агрегирование и фильтрацию, а также анализировать тенденции данных с течением времени. Для Insights нет прямых затрат. Пользователям выставляются счета на основе объема приема данных и параметров хранения данных рабочей области Log Analytics.

Вы можете получить доступ к Инсайтам из Azure Monitor>Инсайты>Azure Local. Используйте следующие вкладки для переключения между представлениями: добавление в мониторинг, работоспособности кластера, узлов, виртуальных машин и хранилища.

Фильтрация результатов

Визуализация может быть отфильтрована по всем подпискам. Результаты можно отфильтровать на основе следующих раскрывающихся меню:

Диапазон времени: этот фильтр позволяет выбрать диапазон для представления тренда. Значение по умолчанию — Последние 24 часа.
Подписки. Показывает подписки, зарегистрированные в локальных кластерах Azure. В этом фильтре можно выбрать несколько подписок.
Кластеры: перечисляет зарегистрированные локальные кластеры Azure, имеющие возможности журналов и мониторинга, включенные в выбранном диапазоне времени. В этом фильтре можно выбрать несколько кластеров.
Группы ресурсов. Этот фильтр позволяет выбрать все кластеры в группе ресурсов.

Добавление в мониторинг

Эта функция содержит сведения о кластерах, которые не отслеживаются пользователем. Чтобы начать мониторинг кластера, выберите его, чтобы открыть этот кластер, а затем выберите Возможности и аналитика". Если кластер не отображается, убедитесь, что он недавно подключен к Azure.

Столбец	Описание	Пример
Кластер	Имя кластера.	27cls1
Состояние подключения Azure	Состояние локального ресурса Azure.	Подключено
Версия ОС	Операционная система устанавливается на узле.	10.0.20348.10131

По умолчанию в представлении сетки отображаются первые 250 строк. Можно задать значение, изменив строки сетки, как показано на следующем рисунке:

Сведения в Excel можно экспортировать, выбрав "Экспорт в Excel ", как показано на следующем рисунке:

Excel предоставит следующее состояние подключения Azure:

0. Не зарегистрировано
1. Отключено
2. Не недавно
3. Подключено

Работоспособность кластера

Это представление содержит обзор работоспособности кластеров.

Столбец	Описание	Пример
Кластер	Имя кластера.	27cls1
Последнее обновление	Метка времени, когда узел был в последний раз обновлён.	4.9.2022, 12:15:42 после полудня
Состояние	Предоставляет состояние работоспособности узлов в кластере. Это может быть здоровое, предупреждающее, критическое или другое.	Здоровый
Ресурс, вызывающий сбой	Описание того, какой ресурс вызвал ошибку.	Сервер, StoragePool, подсистема
Всего узлов	Количество узлов в кластере.	4

Если кластер отсутствует или отображает состояние "Другой", перейдите в рабочую область Log Analytics, используемую для кластера, и убедитесь, что конфигурация агента записывает данные из журнала работоспособности или эксплуатации Microsoft-Windows. Также убедитесь, что кластеры недавно подключались к Azure, и проверьте, что они не исключены из этого отчета.

Узлы

В этом представлении представлен обзор работоспособности узла и производительности и использования выбранных кластеров. Это представление создается с помощью идентификатора события сервера 3000 канала журнала событий Microsoft-Windows-SDDC-Management/Operations Windows. Каждая строка может быть расширена, чтобы увидеть состояние работоспособности узла. Вы можете взаимодействовать с кластером и ресурсом узла, чтобы перейти на соответствующую страницу ресурсов.

Виртуальные машины

Это представление предоставляет состояние всех виртуальных машин в выбранном кластере. Представление создается с помощью идентификатора события виртуальной машины 3003 канала журнала событий Microsoft-Windows-SDDC-Management/Operational Windows Event Log. Каждая строка может быть расширена для просмотра распределения виртуальных машин между узлами в кластере. Вы можете взаимодействовать с ресурсом кластера и узла, чтобы перейти на соответствующую страницу ресурсов.

Метрика	Описание	Пример
Узел кластера >	Имя кластера. При расширении отображаются узлы в кластере.	Образец-VM-1
Последнее обновление	Отметка даты и времени последнего обновления узла.	09.04.2022, 12:24:02
Общее число виртуальных машин	Количество виртуальных машин в узле в кластере.	1 из 2 выполняемых
Бег	Количество виртуальных машин, работающих в узле в кластере.	2
Остановлено	Количество виртуальных машин, остановленных в узле в кластере.	3
Неудачно	Количество виртуальных машин, вышедших из строя в узле кластера.	2
Другие	Если виртуальная машина находится в одном из следующих состояний (неизвестно, запуск, создание моментального снимка, сохранение, остановка, приостановка, возобновление, приостановлено, приостановлено), она считается как находящаяся в другом состоянии.	2

Хранилище

В этом представлении показана работоспособность томов, их использование и производительность в отслеживаемых кластерах. Разверните кластер, чтобы просмотреть состояние отдельных томов. Это представление создается с помощью идентификатора события тома 3002 канала журнала событий Microsoft-Windows-SDDC-Management/Operational Windows. Плитки в верхней части содержат обзор состояния хранилища.

Метрика	Описание	Пример
Том кластера >	Имя кластера. При расширении отображаются тома кластера.	AltaylCluster1 > ClusterPerformanceHistory
Последнее обновление	Дата и время последнего обновления хранилища.	14.04.2022, 14:58:55
Состояние тома	Состояние тома. Это может быть здоровое, предупреждающее, критическое или другое.	Здоровый
Размер	Общая емкость устройства в байтах за отчетный период.	25 млрд
Использование	Процент доступной емкости в течение отчетного периода.	23,54%
Иопс	Количество операций ввода-вывода в секунду.	45/с
Тенденция	Тренд IOPS.
Пропускная способность	Количество байтов в секунду, обрабатываемых Шлюзом приложений	5Б/с
Динамика (B/s)	Тенденция пропускной способности.
Среднее время задержки	Задержка — это среднее время, необходимое для завершения запроса ввода-вывода.	334 мкс

Настройка параметров аналитики

Так как пользовательский интерфейс основан на шаблонах книг Azure Monitor, пользователи могут изменять визуализации и запросы и сохранять их в виде настраиваемой книги.

Если вы используете визуализацию из центра Insights > Azure Monitor > Azure Local, выберите Настроить > Редактировать > Сохранить как, чтобы сохранить копию вашей измененной версии в настраиваемую рабочую книгу.

Рабочие книги сохраняются в группе ресурсов. Все пользователи, имеющие доступ к группе ресурсов, могут получить доступ к настраиваемой рабочей тетради.

Большинство запросов записываются с помощью язык запросов Kusto (KQL). Некоторые запросы записываются с помощью запроса Resource Graph. Дополнительные сведения см. в следующих статьях:

Поддержка

Чтобы открыть запрос в службу поддержки для Insights, используйте службу Insights для локальной службы Azure в разделе "Мониторинг и управление".

Канал журнала событий

Аналитические представления и представления мониторинга основаны на канале журнала событий Windows-SDDC-Management или Operations Windows. Если мониторинг включен, данные из этого канала сохраняются в рабочей области Log Analytics.

Просмотр и изменение интервала дамп-кэша

Интервал по умолчанию для дампа кэша имеет значение 3600 секунд (1 час).

Используйте следующие командлеты PowerShell для просмотра значения интервала дампа кэша:

Get-ClusterResource "sddc management" | Get-ClusterParameter

Используйте следующие командлеты, чтобы настроить частоту дампа кэша. Если задано значение 0, он остановит публикацию событий:

Get-ClusterResource "sddc management" | Set-ClusterParameter -Name CacheDumpIntervalInSeconds -Value <value in seconds>

События Windows в канале журнала событий

Этот канал включает пять событий. Каждое событие имеет имя кластера и идентификатор Azure Resource Manager в качестве EventData.

Идентификатор события	Тип события
3000	Сервер
3001	Диск
3002	Громкость
3003	Виртуальная машина
3004	Кластер

Значение столбца RenderedDescription для серверного события 3000

{
   "m_servers":[
      {
         "m_statusCategory":"Integer",
         "m_status":[
            "Integer",
            "…"
         ],
         "m_id":"String",
         "m_name":"String",
         "m_totalPhysicalMemoryInBytes":"Integer",
         "m_usedPhysicalMemoryInBytes":"Integer",
         "m_totalProcessorsUsedPercentage":"Integer",
         "m_totalClockSpeedInMHz":"Integer",
         "m_uptimeInSeconds":"Integer",
         "m_InboundNetworkUsage":"Double (Bits/sec)",
         "m_OutboundNetworkUsage":"Double (Bits/sec)",
         "m_InboundRdmaUsage":"Double (Bits/sec)",
         "m_OutboundRdmaUsage":"Double (Bits/sec)",
         "m_site":"String",
         "m_location":"String",
         "m_vm":{
            "m_totalVmsUnknown":"Integer",
            "m_totalVmsRunning":"Integer",
            "m_totalVmsStopped":"Integer",
            "m_totalVmsFailed":"Integer",
            "m_totalVmsPaused":"Integer",
            "m_totalVmsSuspended":"Integer",
            "m_totalVmsStarting":"Integer",
            "m_totalVmsSnapshotting":"Integer",
            "m_totalVmsSaving":"Integer",
            "m_totalVmsStopping":"Integer",
            "m_totalVmsPausing":"Integer",
            "m_totalVmsResuming":"Integer"
         },
         "m_osVersion":"String",
         "m_buildNumber":"String",
         "m_totalPhysicalProcessors":"Integer",
         "m_totalLogicalProcessors":"Integer"
      },
      "…"
   ],
   "m_alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }
}

Большинство переменных являются самоочевидными из этой информации JSON. Однако в следующей таблице перечислены несколько переменных, которые немного сложнее понять.

Переменная	Описание
m_серверы	Массив узлов.
м_категорияСтатуса	Состояние работоспособности узла.
m_статус	Состояние узла. Это массив, который может содержать одно или два значения. Первое значение является обязательным (0–4). Второе значение является необязательным (5-9).

Значения переменной m_statusCategory приведены следующим образом:

Значение	Значение
0	Здоровый
1	Предупреждение
2	Нездоровый
255	Другие

Значения для переменной m_status приведены следующим образом:

Значение	Значение
0	Вверх
1	вниз
2	На техническом обслуживании
3	Присоединение
4	Обычная
5	Изолированный
6	Помещено в карантин
7	Осушение
8	Очистка завершена
9	Сбой дренажа
0xffff	Неизвестно

Значение столбца RenderedDescription для события диска номер 3001

Событие дисковое устройство 3001

{
    "m_drives":[
        {
            "m_uniqueId":"String",
            "m_model":"String",
            "m_type":"Integer",
            "m_canPool":"Boolean",
            "m_sizeInBytes":"Integer",
            "m_sizeUsedInBytes":"Integer",
            "m_alerts":{
                "m_totalUnknown":"Integer",
                "m_totalHealthy":"Integer",
                "m_totalWarning":"Integer",
                "m_totalCritical":"Integer"
            }
        },
        "…"
    ],
    "m_correlationId":"String",
    "m_isLastElement":"Boolean"
}

Значение столбца RenderedDescription для события объема с номером 3002

Событие тома 3002

{
   "VolumeList":[
      {
         "m_Id":"String",
         "m_Label":"String",
         "m_Path":"String",
         "m_StatusCategory":"Integer",
         "m_Status":[
            "Integer",
            "…"
         ],
         "m_Size":"Integer (Bytes)",
         "m_SizeUsed":"Integer (Bytes)",
         "m_TotalIops":"Double (Count/second)",
         "m_TotalThroughput":"Double (Bytes/Second)",
         "m_AverageLatency":"Double (Seconds)",
         "m_Resiliency":"Integer",
         "m_IsDedupEnabled":"Boolean",
         "m_FileSystem":"String"
      },
      "…"
   ],
   "m_Alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }
}

Большинство переменных являются понятными из приведённых выше данных JSON. Однако в таблице ниже перечислены несколько переменных, которые немного сложнее понять.

Переменная	Описание
Список томов	Массив томов.
КатегорияСтатуса	Состояние здоровья тома.
m_Статус	Состояние тома. Это массив, который может содержать одно или два значения. Первое значение является обязательным (0–4). Второе значение является необязательным (5-9).

Значения переменной m_statusCategory приведены следующим образом:

Значение	Значение
0	Здоровый
1	Предупреждение
2	Нездоровый
255	Другие

Значения для переменной m_status приведены следующим образом:

Значение	Значение
0	Неизвестно
1	Другие
2	ОК
3	Требуется восстановление
4	Подверженный стрессу
5	Прогнозируемый сбой
6	Ошибка
7	Неустранимая ошибка
8	Запуск
9	Остановка
10	Остановлено
11	В эксплуатации
12	Нет контакта
13 (тринадцать)	Связь потеряна
14	Прервано
15	Бездействующий
16	Поддержка сущности в ошибке
17	Завершено
18	Режим питания
19	Перемещение
0xD002	вниз
0xD003	Требуется повторная синхронизация

Значение столбца RenderedDescription для события виртуальной машины 3003

Событие виртуальной машины 3003

{
   "m_totalVmsUnknown":"Integer",
   "m_totalVmsRunning":"Integer",
   "m_totalVmsStopped":"Integer",
   "m_totalVmsFailed":"Integer",
   "m_totalVmsPaused":"Integer",
   "m_totalVmsSuspended":"Integer",
   "m_totalVmsStarting":"Integer",
   "m_totalVmsSnapshotting":"Integer",
   "m_totalVmsSaving":"Integer",
   "m_totalVmsStopping":"Integer",
   "m_totalVmsPausing":"Integer",
   "m_totalVmsResuming":"Integer",
   "m_alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }
}

Значение столбца RenderedDescription для события кластера 3004

Событие кластера 3004

{
   "m_cpuUsage":"Double (%)",
   "m_totalVolumeIops":"Double",
   "m_averageVolumeLatency":"Double (Seconds)",
   "m_totalVolumeThroughput":"Double (Bytes/Second)",
   "m_totalVolumeSizeInBytes":"Integer",
   "m_usedVolumeSizeInBytes":"Integer",
   "m_totalMemoryInBytes":"Integer",
   "m_usedMemoryInBytes":"Integer",
   "m_isStretch":"Boolean",
   "m_QuorumType":"String",
   "m_QuorumMode":"String",
   "m_QuorumState":"String",
   "m_alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }

Дополнительные сведения о собранных данных см. в разделе Ошибки службы состояния системы.

Следующие шаги

Для получения дополнительной информации см.:

Мониторинг одной локальной системы Azure с помощью Insights

Обратная связь

Были ли сведения на этой странице полезными?

Last updated on 2026-04-23