Настройка коллекции метрик OpenTelemetry для виртуальных машин в Azure Monitor (предварительная версия)

При включении интерфейса на основе метрик для мониторинга виртуальных машин Azure собираются набор метрик по умолчанию. Вы можете настроить коллекцию, чтобы включить дополнительные метрики, такие как производительность каждого процесса, использование логического диска, использование файловой системы и другие метрики для конкретной рабочей нагрузки, изменив правило сбора данных.

Сведения о создании DCR приведены в статье "Сбор данных из клиента виртуальной машины" с помощью Azure Monitor. В этой статье приведены дополнительные сведения о типе источника данных счетчиков производительности OpenTelemetry.

Замечание

Чтобы работать с определением DCR напрямую или развертывать с другими методами, такими как шаблоны ARM, см. примеры правил сбора данных (DCR) в Azure Monitor.

Cost

Набор метрик OpenTelemetry по умолчанию собирается без затрат. Существует дополнительная стоимость сбора дополнительных метрик OTel за пределами набора по умолчанию. См. сведения о ценах на Azure Monitor .

Необходимые условия

Определение правила сбора данных (DCR)

Чтобы определить Правила сбора данных, связанные с виртуальной машиной, откройте Правила сбора данных из меню Монитор в портале Azure. Перейдите на вкладку "Ресурсы" и найдите виртуальную машину.

Снимок экрана: вкладка

Щелкните номер в столбце правил сбора данных, чтобы перечислить правила сбора данных, связанные с виртуальной машиной. DCR OTel будет иметь имя в форме MSVMOtel-<region>-<name>. Щелкните DCR, чтобы открыть его.

Снимок экрана DCR, связанных с выбранным ресурсом.

Настройка источника данных

На вкладке Data sources в DCR щелкните на источник данных OpenTelemetry Performance Counters. Выберите из предопределенного набора объектов для сбора и их частоты выборки. Чем ниже частота выборки, тем чаще собирается значение.

Снимок экрана: форма портала Azure для выбора базовых счетчиков производительности OpenTelemetry в правиле сбора данных.

Выберите "Настраиваемый" для более детального выбора счетчиков производительности OpenTelemetry.

Снимок экрана: форма портала Azure для выбора настраиваемых счетчиков производительности OpenTelemetry в правиле сбора данных.

Проверка сбора данных

Чтобы проверить сбор счетчиков производительности OpenTelemetry, отправьте запрос в рабочую область Azure Monitor и убедитесь, что данные возвращаются для выбранных метрик.

Снимок экрана: записи, возвращенные из AMW.

Если рабочая область была задана в режиме доступа к контексту ресурсов, можно также убедиться, что тот же запрос работает должным образом при ограничении его области действия виртуальной машиной, перейдя в раздел метрик виртуальных машин. Выберите раскрывающееся меню добавить с редактором или раскрывающееся меню Просмотр метрик AMW в редакторе в разделе Пространства имен метрик.

Снимок экрана, показывающий, как перейти к редактору AMW PromQL с панели метрик виртуальной машины.

Обе точки входа теперь должны привести к редактору PromQL, в котором запрос применён к ресурсу виртуальной машины, где тот же запрос будет работать как раньше, но без необходимости фильтровать по атрибуту VM microsoft.resourceid.

Снимок экрана: записи, возвращенные из виртуальной машины, хранящиеся в AMW.

Снимок экрана, показывающий, что запрос ограничен виртуальной машиной, а не AMW.

Справочник по показателям

В следующих таблицах перечислены метрики OpenTelemetry, доступные для виртуальных машин.

Метрики по умолчанию

Метрики в следующей таблице собираются по умолчанию и без дополнительных затрат.

Имя метрики Описание
system.uptime Время после последней перезагрузки (в секундах)
system.cpu.time Общее время, затраченное на ЦП (пользователь + система + бездействие), в секундах
использование памяти системы Использование памяти (байты)
system.network.io Байты, передаваемые или полученные
system.network.dropped Потерянные пакеты
System.network.errors Ошибки сети.
system.disk.io Операции ввода-вывода диска (байты чтения и записи)
операции с системой диска Операции с дисками (количество операций чтения и записи)
система.файловая_система.использование Использование файловой системы в байтах
система.диск.время_работы Среднее время операции диска

Дополнительные метрики

Метрики в следующей таблице можно собирать, изменив DCR для виртуальной машины, как описано выше. Для сбора этих метрик требуется дополнительная стоимость.

Имя метрики Описание
загруженность процессора системы % использования ЦП
system.cpu.logical.count Количество логических процессоров
система.ЦП.первое.количество Количество физических ЦП
система.ЦПУ.частота Частота ЦП
система.ЦПУ.средняя_нагрузка.1м Среднее значение нагрузки системы (1 мин)
системa.cpu.средняя_нагрузка_за_5м Среднее значение нагрузки системы (5 мин)
system.cpu.load_average.15m Среднее значение нагрузки системы (15 мин)
система.использование_памяти % используемой памяти
лимит.памяти.системы Общий объем памяти
система.память.размер_страницы Размер страницы (байты)
system.linux.memory.available Доступная память
system.linux.memory.dirty Грязные страницы памяти
система.страничная.подкачка.ошибки Ошибки страниц
system.paging.operations Пейджинговые операции (чтение/запись)
system.paging.usage Использование разбиения на страницах и переключения (байты)
system.paging.utilization используется % разбиение по страницам и переключению
system.disk.io_time Время, затраченное на выполнение операций ввода-вывода
система.диск.объединённый Количество объединенных операций
system.disk.ожидающие_операции Ожидающие операции ввода-вывода
system.disk.weighted_io_time Взвешенное время ввода-вывода (с учетом глубины очереди)
система.файловая_система.использование Использование файловой системы %
system.filesystem.inodes.usage Использование инодов
система.сеть.пакеты Пакеты, передаваемые и полученные
система.сеть.соединения Активные сетевые подключения
system.network.conntrack.count Текущие записи таблицы conntrack
system.network.conntrack.max Максимальный размер таблицы conntrack
process.uptime Время безотказной работы процесса
process.cpu.time Время ЦП, затраченное процессом
использование.процессора.процесс员工 Использование ЦП % для каждого процесса
process.использование памяти Использование памяти (RSS)
Процесс.Память.Виртуальная Использование виртуальной памяти
использование памяти процесса Использование % памяти
process.disk.io Операции ввода-вывода диска (байты для каждого процесса)
процесс.операции.диска Операции с дисками на процесс
процесс.пейджинг.ошибки Ошибки страниц обработки
process.open_file_descriptors Открытые дескрипторы файлов
process.threads Количество потоков
process.handles Дескриптор использования (Windows)
переключения контекста процесса Переключение контекста
процесс.ожидающие_сигналы Ожидающие сигналы
system.processes.count (количество процессов системы) Общее количество процессов
система.процессы.созданы Созданные процессы

Полный справочник по типам, единицам, измерениям и другим метаданным см. в справочнике по метрикам OpenTelemetry.

Дальнейшие действия