Поделиться через


Мониторинг одной локальной системы Azure с помощью Insights

Область применения: Azure Local 2311.2 и более поздних версий

В этой статье описывается, как использовать Аналитику для мониторинга одной локальной системы Azure. Сведения о нескольких локальных системах Azure см. в статье "Мониторинг нескольких локальных систем Azure" с помощью Аналитики.

Аналитика — это функция Azure Monitor, которая быстро запускает мониторинг локальной системы Azure. Вы можете просматривать ключевые метрики, работоспособности и использования, касающиеся кластера, узлов, виртуальных машин и хранилища.

Посмотрите ознакомительное видео по Инсайтам для Azure Local.

Льготы

Аналитика для Azure Local предлагает следующие преимущества:

  • Управляется Azure. Управление службой Insights осуществляется через Azure, а доступ к ней обеспечивается через портал Azure, что гарантирует её постоянную актуальность. Нет необходимости в настройке базы данных или специального программного обеспечения.

  • Масштабируемость. Insights может загружать более 400 наборов данных о кластерах по нескольким подпискам одновременно. Нет ограничений на кластер, домен или физическое расположение.

  • Возможность настройки. Опыт использования Insight построен на шаблонах рабочих книг Azure Monitor. Это позволяет изменять представления и запросы, изменять или задавать пороговые значения, которые соответствуют определенным ограничениям, а затем сохранять эти настройки в книге. Затем вы можете закрепить диаграммы в рабочих книгах на панели мониторинга Azure.

Предварительные условия

Ниже приведены предварительные требования к использованию Insights для Azure Local:

  • У вас должен быть доступ к локальной системе Azure, развернутой и зарегистрированной.

  • Управляемая идентификация для ресурса Azure должна быть активирована. Дополнительные сведения см. в статье "Включено расширенное управление".

Включить инсайты

Функция Enabling Insights помогает отслеживать все локальные системы Azure, которые в данный момент связаны с рабочей областью Log Analytics, предоставляя полезные метрики работоспособности. Аналитика устанавливает агент Azure Monitor и помогает настроить правила сбора данных (DCR) для мониторинга локальной системы Azure.

Сведения о том, как включить аналитику в масштабе, см. в статье "Включение аналитики для локальной службы Azure" в масштабе с помощью политик Azure.

Выполните следующие действия, чтобы включить аналитику из портал Azure:

  1. В портал Azure перейдите на страницу локальных ресурсов Azure, а затем выберите систему. На вкладке "Возможности" выберите "Аналитика".

    Снимок экрана: плитка Insights.

  2. На странице "Аналитика" выберите "Начало работы".

    Снимок экрана: кнопка

  3. На странице конфигурации Инсайтов выберите существующий DCR в раскрывающемся списке правила сбора данных. DCR указывает журналы событий и счетчики производительности, которые необходимо собирать и хранить в рабочей области Log Analytics. Insights создает DCR по умолчанию, если он еще не существует. Включены только DCR, настроенные для использования в Insights.

    Снимок экрана: окно конфигурации Insights.

  4. (Необязательно) Вы также можете создать новый DCR, выбрав Создать новый на странице конфигурации Инсайтов.

    Внимание

    Настоятельно рекомендуется не создавать собственный DCR. DCR, созданный с помощью Insights, включает специальный поток данных, необходимый для функционирования. Этот DCR можно изменить для сбора дополнительных данных, таких как события Windows и Syslog. Созданные через установку AMA DCR будут иметь префикс AzureStackHCI-, добавленный к имени DCR.

    1. На странице "Новое правило сбора данных " укажите имя подписки, имя DCR и конечную точку сбора данных (DCE). Конечные точки сбора данных используются для доступа к службе конфигурации с целью получения связанных правил сбора данных для агента Azure Monitor. Дополнительные сведения о DCE см. в статье "Конечные точки сбора данных" в Azure Monitor.

      Примечание.

      Если вы используете закрытые ссылки на агенте, необходимо добавить DCE. Дополнительные сведения о параметрах сети AMA см. в разделе "Определение параметров сети агента Azure Monitor".

      Снимок экрана: окно правила сбора данных.

    2. Нажмите кнопку "Просмотр и создание ".

      Если DCR еще не создан для немонитоизованного кластера, он создается с включенными счетчиками производительности и каналом журнала событий Windows.

  5. Просмотрите окончательный экран с сводкой по имени DCR, количеству журналов событий, счетчикам производительности и имени рабочей области Log Analytics, в которой хранятся данные. Выберите Настроить.

    Снимок экрана: раскрывающийся селектор правила сбора данных.

    После выбора настройки вы будете перенаправлены на страницу расширений , где можно просмотреть состояние установки агента. Настроив Insights, AMA автоматически устанавливается на всех узлах кластера.

  6. Перейдите на страницу локального ресурса Azure и выберите систему. Аналитика теперь отображается как настроенная на вкладке "Возможности" :

    Снимок экрана: плитка Insights в настроенном виде.

Правила сбора данных

При включении Инсайтов на компьютере с агентом Azure Monitor необходимо указать используемый DCR. Дополнительные сведения о правилах сбора данных см. в разделе "Правила сбора данных" в Azure Monitor.

Выбор Описание
Счетчики производительности Указывает, какие счетчики производительности данных следует собирать из операционной системы. Этот параметр необходим для всех компьютеров. Эти счетчики производительности используются для заполнения графических представлений в рабочей книге Insights. В настоящее время в книге Insights используются пять счетчиков производительности: Memory()\Available Bytes, Network Interface()\Bytes Total/sec, Processor(_Total)\% Processor Time, RDMA Activity()\RDMA Inbound Bytes/sec и RDMA Activity()\RDMA Outbound Bytes/sec.
Канал журнала событий Указывает, какие журналы событий Windows собираются из операционной системы. Этот параметр необходим для всех компьютеров. Журналы событий Windows используются для заполнения визуализаций в книге Insights. В настоящее время данные собираются с помощью двух каналов журнала событий Windows: - microsoft-windows-health/operationalmicrosoft-windows-sddc-management/operational
Рабочая область Log Analytics Рабочая область для хранения данных. Перечисляются только рабочие пространства с функцией "Insights".

Канал событий

Канал событий Windows Microsoft-windows-sddc-management/operational и Microsoft-windows-health/operational добавляется в вашу рабочую область Log Analytics в разделе журналы событий Windows.

Снимок экрана: окно добавления источника данных.

Собирая эти журналы, Insights показывает состояние работоспособности отдельных узлов, дисков, томов и виртуальных машин. По умолчанию добавляются пять счетчиков производительности.

Счетчики производительности

По умолчанию добавляются пять счетчиков производительности:

Снимок экрана: добавленные счетчики производительности.

В следующей таблице описываются отслеживаемые счетчики производительности:

Счетчики производительности Описание
Память(*)\Доступные байты Доступные байты — это объем физической памяти в байтах, который сразу же доступен для выделения в процессе или для использования системой.
Сетевой интерфейс(*)\Всего байт/с Скорость, с которой байты отправляются и принимаются по каждому сетевому адаптеру, включая символы кадрирования. Всего байтов в секунду — это сумма байтов, полученных в секунду, и байтов, отправленных в секунду.
Процессор(_Всего)% Время работы процессора Процент истекшего времени, когда все потоки обработки использовали обработчик для выполнения инструкций.
Активность RDMA(*)\Входящие байты/сек Скорость передачи данных по протоколу RDMA сетевым адаптером в секунду.
Действие RDMA(*)\исходящие байты RDMA в секунду Скорость передачи данных по протоколу RDMA сетевым адаптером в секунду.

После включения Аналитики может потребоваться до 15 минут для сбора данных. После завершения процесса вы сможете увидеть многофункциональную визуализацию работоспособности кластера из меню "Аналитика " на левой панели:

Снимок экрана, демонстрирующий визуализации Insight.

Отключение инсайтов

Чтобы отключить Аналитику, выполните следующие действия.

  1. Выберите "Аналитика" на вкладке "Возможности ".

  2. Выберите "Отключить аналитику".

    Снимок экрана: окно

При отключении функции Insights связь между правилом сбора данных и кластером удаляется, и журналы службы работоспособности и управления SDDC больше не собираются. Однако существующие данные не удаляются. Если вы хотите удалить эти данные, перейдите в рабочую область DCR и Log Analytics и удалите эти данные вручную.

Обновить Аналитику

На плитке Insights отображается сообщение Требуется обновить в следующих случаях:

  • Правило сбора данных изменено.
  • Событие состояния системы из журнала событий Windows удаляется.
  • Удаляется любой из пяти счетчиков производительности из рабочей области Log Analytics .

Чтобы включить аналитику снова, выполните следующие действия.

  1. Выберите плитку Insights в разделе "Возможности".

  2. Нажмите кнопку "Обновить", чтобы просмотреть визуализации снова.

    Снимок экрана: окно Update Insights.

Устранение неполадок

В этом разделе приводятся рекомендации по устранению проблем с использованием Аналитики для локальной среды Azure.

Как устранить неполадки с пустой страницей рабочей книги, где данные не загружены

Проблема. Вы видите пустую страницу книг Workbooks, на которой данные не заполнены, как показано на следующем снимке экрана.

Снимок экрана пустой страницы рабочих тетрадей.

Возможные причины. Эта проблема может быть вызвана несколькими факторами, такими как недавнее изменение конфигурации системы Аналитики или неправильная настройка связанного DCR.

Решение. Чтобы устранить проблему, выполните следующие действия в последовательности:

  1. Если вы недавно настроили Insights, подождите до одного часа, пока AMA будет собирать данные.
  2. Проверьте конфигурацию связанного DCR. Убедитесь, что каналы событий и счетчики производительности добавляются в качестве источников данных в связанный DCR, как описано в разделе "Правила сбора данных".
  3. Если проблема сохраняется после выполнения описанных выше действий, и вы по-прежнему не видите никаких данных, обратитесь в службу поддержки клиентов за помощью.

Дополнительные сведения об устранении неполадок см. в руководстве по устранению неполадок агента Azure Monitor.

Визуализации инсайтов

После включения Аналитики в следующих таблицах содержатся сведения обо всех ресурсах.

Здоровье

Предоставляет неисправности здоровья в кластере.

Вы можете просматривать проблемы со работоспособностью, такие как неподдерживаемое оборудование, неподдерживаемый диск, неправильные записи блоков, отсоединенные диски, потребности восстановления, превышение ресурсов ЦП, памяти и использования хранилища, а также высокая задержка. Полный список поддерживаемых сбоев работоспособности см. в разделе "Просмотр сбоев службы работоспособности".

Единица измерения Описание Единица Пример
Неисправность Краткое описание сбоев работоспособности. Щелкнув ссылку, откроется боковая панель с дополнительными сведениями. Нет единицы ПорогВместимостиБассейнаПревышен
Тип ресурса, вызывающего сбой Тип ресурса, который столкнулся с ошибкой. Нет единицы StoragePool
Идентификатор сбойного ресурса Уникальный идентификатор ресурса, у которого обнаружена ошибка работоспособности. Уникальный идентификатор {a0a0a0a0-bbbb-cccc-ddddd-e1e1e1e1e1e1}: SP:{b1b1b1b1b1b1-cccc-dddd-eeee-f2f2f2f2f2f2f2f2f2f2f2f2}
Серьезность Серьезность сбоя может быть предупредительной или критической. Нет единицы Предупреждение
Начальное время сбоя Метка времени последнего обновления узла. Дата и время 4.9.2022, 12:15:42 после полудня

Узлы

Предоставляет сведения о работоспособности и производительности серверов.

Единица измерения Описание Единица Пример
Узлы Имена узлов в кластере. Нет единицы VM-1
Последнее обновление Дата и время последнего обновления узла. Дата и время 4.9.2022, 12:15:42 после полудня
Состояние Состояние работоспособности узлов в кластере. Это может быть здорово, предупреждение, критическое и другое Здоровый
Использование процессора Процент времени, когда процесс использовал ЦП. Процент 56 %
Использование памяти Использование памяти узлового процесса равно счетчику Process\Private Bytes плюс размер сопоставленных с памятью данных. Процент 16 %
Логические процессоры Количество логических процессоров. Численность 2
ЦП Количество ЦП. Численность 2
Время безотказной работы Время, в течение которого машина, особенно компьютер, работает. Временной диапазон 2.609 ч.
Сайт Имя сайта, к которому принадлежит узел. Имя сайта SiteA
Доменное имя Локальный домен, к которому принадлежит узел. Нет единицы Contoso.local

Виртуальные машины

Предоставляет состояние виртуальных машин на каждом узле в кластере. Виртуальная машина может находиться в одном из следующих состояний: работа, остановлено, неудача или другое (неизвестно, запуск, создание моментального снимка, сохранение, остановка, приостановка, возобновление, паузе, спящий режим).

Единица измерения Описание Единица Пример
Узлы Имя узла. Нет единицы Образец-VM-1
Последнее обновление Это дает дату и время последнего обновления узла Дата и время 4.9.2022, 12:24:02 после полудня
Общее число виртуальных машин Количество виртуальных машин в узле. Численность 0 из 0 запущено
Бег Количество виртуальных машин, работающих в узле. Численность 2
Остановлено Количество виртуальных машин, остановленных на узле. Численность 3
Неудачно Количество виртуальных машин, вышедших из строя на узле. Численность 2
Другие Если виртуальная машина находится в одном из следующих состояний (неизвестно, запуск, создание моментального снимка, сохранение, остановка, приостановка, возобновление, приостановлено, приостановлено), она считается как находящаяся в другом состоянии. Численность 2

Хранение

В следующей таблице приведены сведения о работоспособности томов и дисков в кластере:

Единица измерения Описание Единица Пример
Объемы Имя тома Нет единицы История Производительности Кластера
Последнее обновление Дата и время последнего обновления хранилища. Дата и время 14.04.2022, 14:58:55
Состояние Состояние тома. Нормально, предупреждение, критическое и другое. Здоровый
Общая емкость Общая емкость устройства в байтах за отчетный период. Байт 2.5 ГБ
Доступная емкость Доступная емкость в байтах в отчетный период. Байт 20 Б
Иопс Количество операций ввода-вывода в секунду. в секунду. 45/с
Пропускная способность Количество байтов в секунду, обрабатываемых Шлюзом приложений Байты в секунду 5Б/с
Задержка Время выполнения запроса ввода-вывода. Второй 0.0016 s
Устойчивость Способность восстанавливаться после сбоев. Обеспечивает максимальную доступность данных. Нет единицы Трехстороннее зеркало
Дедупликация Процесс уменьшения физического числа байтов данных, которые должны храниться на диске. Доступно или нет Да/нет
Файловая система Тип файловой системы. Нет единицы Файловая система ReFS (Resilient File System)

Цены на Azure Monitor

При включении визуализации мониторинга журналы собираются из:

  • Управление работоспособностью (Microsoft-windows-health/operational).
  • Управление SDDC (Microsoft-Windows-SDDC-Management/Operational; Идентификатор события: 3000, 3001, 3002, 3003, 3004).

Плата взимается на основе объема приема данных и параметров хранения данных рабочей области Log Analytics.

Azure Monitor имеет плату по мере использования, и первые 5 ГБ на учётную запись в месяц бесплатны. Так как цены могут отличаться из-за нескольких факторов, таких как регион Azure, который вы используете, посетите калькулятор цен Azure Monitor для наиболее up-toрасчетов цен на дату.

Следующие шаги