Поделиться через


Поддерживаемые метрики для Microsoft.MachineLearningServices/workspaces

В следующей таблице перечислены метрики, доступные для типа ресурса Microsoft.MachineLearningServices/workspaces.

Заголовки таблиц

Метрика — отображаемое имя метрик, как оно отображается на портале Azure.
Имя в REST API — название метрики, как называется в REST API.
Единица измерения.
Агрегирование — тип агрегирования по умолчанию. Допустимые значения: среднее, минимальное, максимальное, общее, число.
Измерения - Измерения, доступные для метрики.
Зерна времени - Интервалы, через которые выполняется выборка метрики. Например, указывает, PT1M что метрика выборка выполняется каждую минуту, каждые 30 минут, PT30MPT1H каждый час и т. д.
Экспорт DS— можно ли экспортировать метрики в журналы Azure Monitor с помощью параметров диагностики.

Сведения об экспорте метрик см. в разделе " Метрики", экспортируемые с помощью правил сбора данных и создание параметров диагностики в Azure Monitor.

Сведения о хранении метрик см. в обзоре метрик Azure Monitor.

Список поддерживаемых журналов см. в разделе "Поддерживаемые категории журналов" — Microsoft.MachineLearningServices/workspaces

Категория: агенты

Метрика Имя в REST API Единица измерения Агрегация Измерения Интервалы времени Экспорт DS
Агенты

Количество событий для агентов ИИ в этом рабочем пространстве
Agents Численность Среднее, максимальное, минимальное, общее (сумма) EventType ПТ1М нет
ИндексированныеФайлы

Количество файлов, индексированных для поиска файлов в этой рабочей области
IndexedFiles Численность Среднее, максимальное, минимальное, общее (сумма) ErrorCode, , StatusVectorStoreId ПТ1М нет
Сообщения

Количество событий для сообщений агента ИИ в этой рабочей области
Messages Численность Среднее, максимальное, минимальное, общее (сумма) EventType, ThreadId ПТ1М нет
Запуски

Количество запусков агентов ИИ в этой рабочей области
Runs Численность Среднее, максимальное, минимальное, общее (сумма) AgentId, RunStatusStatusCodeStreamType ПТ1М нет
Потоки

Количество событий для трейдов ИИ-агента в этой рабочей области
Threads Численность Среднее, максимальное, минимальное, общее (сумма) EventType ПТ1М нет
Токены

Количество токенов агентов ИИ в этой рабочей среде
Tokens Численность Среднее, максимальное, минимальное, общее (сумма) AgentId, TokenType ПТ1М нет
ToolCalls

Вызовы инструментов, сделанные агентами искусственного интеллекта в этом рабочем пространстве
ToolCalls Численность Среднее, максимальное, минимальное, общее (сумма) AgentId, ToolName ПТ1М нет

Категория: модель

Метрика Имя в REST API Единица измерения Агрегация Измерения Интервалы времени Экспорт DS
Сбой развертывания модели

Число развертываний моделей, завершившихся сбоем в этой рабочей области
Model Deploy Failed Численность Итог (сумма), среднее, минимальное, максимальное, число Scenario, StatusCode ПТ1М Да
Начало развертывания модели

Число развертываний моделей, запущенных в этой рабочей области
Model Deploy Started Численность Итог (сумма), среднее, минимальное, максимальное, число Scenario ПТ1М Да
Развертывание модели прошло успешно

Число развертываний моделей, завершившихся успешно в этой рабочей области
Model Deploy Succeeded Численность Итог (сумма), среднее, минимальное, максимальное, число Scenario ПТ1М Да
Сбой регистра модели

Число неудачных регистраций моделей в этой рабочей области
Model Register Failed Численность Итог (сумма), среднее, минимальное, максимальное, число Scenario, StatusCode ПТ1М Да
Регистрация модели выполнена успешно

Число регистраций моделей, завершившихся успешно в этой рабочей области
Model Register Succeeded Численность Итог (сумма), среднее, минимальное, максимальное, число Scenario ПТ1М Да

Категория: квота

Метрика Имя в REST API Единица измерения Агрегация Измерения Интервалы времени Экспорт DS
Активные ядра

Число активных ядер
Active Cores Численность Среднее, максимальное, минимальное, общее (сумма) Scenario, ClusterName ПТ1М Да
Активные узлы

Число активных узлов. Это узлы, активно выполняющие задание.
Active Nodes Численность Среднее, максимальное, минимальное, общее (сумма) Scenario, ClusterName ПТ1М Да
Неактивные ядра

Число бездействующих ядер
Idle Cores Численность Среднее, максимальное, минимальное, общее (сумма) Scenario, ClusterName ПТ1М Да
Неактивные узлы

Количество узлов в неактивном состоянии. Узлы в неактивном состоянии — это узлы, на которых не выполняются никакие задания, но они могут принимать новые задания.
Idle Nodes Численность Среднее, максимальное, минимальное, общее (сумма) Scenario, ClusterName ПТ1М Да
Отключение ядер

Число освобождаемых ядер
Leaving Cores Численность Среднее, максимальное, минимальное, общее (сумма) Scenario, ClusterName ПТ1М Да
Покидающие узлы

Число покидающих узлов. Освобождаемые узлы — это узлы, которые только что завершили обработку задания и переходят в неактивное состояние.
Leaving Nodes Численность Среднее, максимальное, минимальное, общее (сумма) Scenario, ClusterName ПТ1М Да
Предварительно подготовленные ядра

Количество замещенных ядер
Preempted Cores Численность Среднее, максимальное, минимальное, общее (сумма) Scenario, ClusterName ПТ1М Да
Вытесненные узлы

Количество вытеснённых узлов. Это узлы с низким приоритетом, взятые из пула доступных узлов.
Preempted Nodes Численность Среднее, максимальное, минимальное, общее (сумма) Scenario, ClusterName ПТ1М Да
Процент использования квоты

Процент использования квоты
Quota Utilization Percentage Численность Среднее, максимальное, минимальное, общее (сумма) Scenario, ClusterName, VmFamilyName, VmPriority ПТ1М Да
Общее число ядер

Общее число ядер
Total Cores Численность Среднее, максимальное, минимальное, общее (сумма) Scenario, ClusterName ПТ1М Да
Всего узлов

Общее число узлов. В это число входят некоторые из активных узлов, бездействующих узлов, неиспользуемых узлов, приостановленных узлов и освобождаемых узлов.
Total Nodes Численность Среднее, максимальное, минимальное, общее (сумма) Scenario, ClusterName ПТ1М Да
Неиспользуемые ядра

Число ядер, непригодных для использования
Unusable Cores Численность Среднее, максимальное, минимальное, общее (сумма) Scenario, ClusterName ПТ1М Да
Неиспользуемые узлы

Число узлов, непригодных для использования. Узлы, непригодные для использования, не работают из-за неразрешимой проблемы. Azure выполнит повторный запуск этих узлов.
Unusable Nodes Численность Среднее, максимальное, минимальное, общее (сумма) Scenario, ClusterName ПТ1М Да

Категория: ресурс

Метрика Имя в REST API Единица измерения Агрегация Измерения Интервалы времени Экспорт DS
CpuCapacityMillicores

Максимальная производительность узла ЦП в millicores. Емкость агрегируется за интервал длительностью 1 минута.
CpuCapacityMillicores Численность Среднее, максимальное, минимальное, общее (сумма) RunId, , InstanceIdComputeName ПТ1М Да
CpuMemoryCapacityMegabytes

Максимальный уровень использования памяти для узла ЦП в мегабайтах. Сведения об использовании агрегируются за интервал длительностью 1 минута.
CpuMemoryCapacityMegabytes Численность Среднее, максимальное, минимальное, общее (сумма) RunId, , InstanceIdComputeName ПТ1М Да
CpuMemoryUtilizationMegabytes

Уровень использования памяти для узла ЦП в мегабайтах. Сведения об использовании агрегируются за интервал длительностью 1 минута.
CpuMemoryUtilizationMegabytes Численность Среднее, максимальное, минимальное, общее (сумма) RunId, , InstanceIdComputeName ПТ1М Да
CpuMemoryUtilizationPercentage

Процент использования памяти для узла ЦП. Сведения об использовании агрегируются за интервал длительностью 1 минута.
CpuMemoryUtilizationPercentage Численность Среднее, максимальное, минимальное, общее (сумма) RunId, , InstanceIdComputeName ПТ1М Да
Использование процессора

Процент использования на узле ЦП. Сведения об использовании поступают каждую минуту.
CpuUtilization Численность Среднее, максимальное, минимальное, общее (сумма) Scenario, runId, NodeId, ClusterName ПТ1М Да
CpuUtilizationMillicores

Сведения об использовании узла ЦП в MilliCores. Сведения об использовании агрегируются за интервал длительностью 1 минута.
CpuUtilizationMillicores Численность Среднее, максимальное, минимальное, общее (сумма) RunId, , InstanceIdComputeName ПТ1М Да
CpuUtilizationPercentage

Процент использования узла ЦП. Сведения об использовании агрегируются за интервал длительностью 1 минута.
CpuUtilizationPercentage Численность Среднее, максимальное, минимальное, общее (сумма) RunId, , InstanceIdComputeName ПТ1М Да
DiskAvailMegabytes

Доступное дисковое пространство, в мегабайтах. Метрики собираются с периодичностью в 1 минуту.
DiskAvailMegabytes Численность Среднее, максимальное, минимальное, общее (сумма) RunId, , InstanceIdComputeName ПТ1М Да
DiskReadMegabytes

Данные считываются с диска в мегабайтах. Метрики собираются с периодичностью в 1 минуту.
DiskReadMegabytes Численность Среднее, максимальное, минимальное, общее (сумма) RunId, , InstanceIdComputeName ПТ1М Да
DiskUsedMegabytes

Используемое дисковое пространство, в мегабайтах. Метрики собираются с периодичностью в 1 минуту.
DiskUsedMegabytes Численность Среднее, максимальное, минимальное, общее (сумма) RunId, , InstanceIdComputeName ПТ1М Да
DiskWriteMegabytes

Данные, записанные на диск, в мегабайтах. Метрики собираются с периодичностью в 1 минуту.
DiskWriteMegabytes Численность Среднее, максимальное, минимальное, общее (сумма) RunId, , InstanceIdComputeName ПТ1М Да
GpuCapacityMilliGPUs

Максимальная производительность устройства ГПУ в милли-ГПУ. Емкость агрегируется за интервал длительностью 1 минута.
GpuCapacityMilliGPUs Численность Среднее, максимальное, минимальное, общее (сумма) RunId, InstanceId, DeviceId, ComputeName ПТ1М Да
GpuEnergyJoules

Интервальное энергопотребления в джоулях на узле GPU. Сведения об энергопотреблении поступают каждую минуту.
GpuEnergyJoules Численность Среднее, максимальное, минимальное, общее (сумма) Scenario, runId, rootRunId, InstanceId, DeviceId, ComputeName ПТ1М Да
GpuMemoryCapacityMegabytes

Максимальный объем памяти для устройства GPU в мегабайтах. Мощность агрегируется с интервалом в одну минуту.
GpuMemoryCapacityMegabytes Численность Среднее, максимальное, минимальное, общее (сумма) RunId, InstanceId, DeviceId, ComputeName ПТ1М Да
GpuMemoryUtilization

Процент использования памяти на узле GPU. Сведения об использовании поступают каждую минуту.
GpuMemoryUtilization Численность Среднее, максимальное, минимальное, общее (сумма) Scenario, , runIdNodeId, DeviceIdClusterName ПТ1М Да
GpuMemoryUtilizationMegabytes

Использование памяти устройством GPU в мегабайтах. Использование памяти агрегируется каждую минуту.
GpuMemoryUtilizationMegabytes Численность Среднее, максимальное, минимальное, общее (сумма) RunId, InstanceId, DeviceId, ComputeName ПТ1М Да
GpuMemoryUtilizationPercentage

Процент использования памяти устройством GPU. Использование памяти агрегируется каждую минуту.
GpuMemoryUtilizationPercentage Численность Среднее, максимальное, минимальное, общее (сумма) RunId, InstanceId, DeviceId, ComputeName ПТ1М Да
GpuUtilization

Процент использования на узле GPU. Сведения об использовании поступают каждую минуту.
GpuUtilization Численность Среднее, максимальное, минимальное, общее (сумма) Scenario, , runIdNodeId, DeviceIdClusterName ПТ1М Да
GpuUtilizationMilliGPUs

Использование устройства GPU в милли-GPU. Сведения об использовании агрегируются за интервал длительностью 1 минута.
GpuUtilizationMilliGPUs Численность Среднее, максимальное, минимальное, общее (сумма) RunId, InstanceId, DeviceId, ComputeName ПТ1М Да
GpuUtilizationPercentage

Процент использования устройства GPU. Сведения об использовании агрегируются за интервал длительностью 1 минута.
GpuUtilizationPercentage Численность Среднее, максимальное, минимальное, общее (сумма) RunId, InstanceId, DeviceId, ComputeName ПТ1М Да
IBReceiveMegabytes

Данные сети, полученные через InfiniBand, в мегабайтах. Метрики собираются с периодичностью в 1 минуту.
IBReceiveMegabytes Численность Среднее, максимальное, минимальное, общее (сумма) RunId, InstanceId, ComputeName, DeviceId ПТ1М Да
IBTransmitMegabytes

Данные сети, отправленные через InfiniBand, в мегабайтах. Метрики собираются с периодичностью в 1 минуту.
IBTransmitMegabytes Численность Среднее, максимальное, минимальное, общее (сумма) RunId, InstanceId, ComputeName, DeviceId ПТ1М Да
NetworkInputMegabytes

Полученные данные сети в мегабайтах. Метрики собираются с периодичностью в 1 минуту.
NetworkInputMegabytes Численность Среднее, максимальное, минимальное, общее (сумма) RunId, InstanceId, ComputeName, DeviceId ПТ1М Да
Выход данных сети в мегабайтах

Отправленные данные сети в мегабайтах. Метрики собираются с периодичностью в 1 минуту.
NetworkOutputMegabytes Численность Среднее, максимальное, минимальное, общее (сумма) RunId InstanceId ComputeName DeviceId ПТ1М Да
StorageAPIFailureCount

Число сбоев вызовов API Хранилища BLOB-объектов Azure.
StorageAPIFailureCount Численность Среднее, максимальное, минимальное, общее (сумма) RunId, , InstanceIdComputeName ПТ1М Да
StorageAPISuccessCount

Число успешных вызовов API хранилища объектов BLOB Azure.
StorageAPISuccessCount Численность Среднее, максимальное, минимальное, общее (сумма) RunId, , InstanceIdComputeName ПТ1М Да

Категория: Запуск

Метрика Имя в REST API Единица измерения Агрегация Измерения Интервалы времени Экспорт DS
Отмена запрошенных запусков

Количество запусков, для которых была запрошена отмена для этой рабочей области. Счетчик обновляется при получении запроса на отмену выполнения.
Cancel Requested Runs Численность Итог (сумма), среднее, минимальное, максимальное, число Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName ПТ1М Да
Отмененные запуски

Количество запусков, отмененных для этой рабочей области. Счетчик обновляется при успешной отмене выполнения.
Cancelled Runs Численность Итог (сумма), среднее, минимальное, максимальное, число Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName ПТ1М Да
Завершенные запуски

Число выполнений, успешно завершенных для этой рабочей области. Значение счетчика обновляется после завершения выполнения процесса и сбора выходных данных.
Completed Runs Численность Итог (сумма), среднее, минимальное, максимальное, число Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName ПТ1М Да
Ошибки

Число ошибок запуска в этой рабочей области. Значение счетчика обновляется при возникновении ошибки в процессе выполнения.
Errors Численность Итог (сумма), среднее, минимальное, максимальное, число Scenario ПТ1М Да
Неудачные запуски

Количество запусков, завершившихся сбоем для этой рабочей области. Значение счетчика обновляется при сбое выполнения.
Failed Runs Численность Итог (сумма), среднее, минимальное, максимальное, число Scenario RunType PublishedPipelineId ComputeType PipelineStepType ExperimentName ПТ1М Да
Завершение выполнения

Число выполнений, вошедших в состояние завершения для этой рабочей области. Значение счетчика обновляется, как выполнение уже завершено, но сбор выходных данных еще выполняется.
Finalizing Runs Численность Итог (сумма), среднее, минимальное, максимальное, число Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName ПТ1М Да
Неотвечающие процессы

Количество процессов, не реагирующих в этой рабочей области. Значение счетчика обновляется, когда выполнение переходит в состояние "Не отвечает".
Not Responding Runs Численность Итог (сумма), среднее, минимальное, максимальное, число Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName ПТ1М Да
Не начавшиеся запуски

Число запусков в состоянии "Не запущено" для этой рабочей области. Значение счетчика обновляется при получении запроса о запуске выполнения, однако информация о выполнении еще не введена.
Not Started Runs Численность Итог (сумма), среднее, минимальное, максимальное, число Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName ПТ1М Да
Подготовка запусков

Количество запусков, которые подготавливаются для этой рабочей области. Значение счетчиков обновляется, когда запуск переходит в состояние подготовки, одновременно с подготовкой среды выполнения.
Preparing Runs Численность Итог (сумма), среднее, минимальное, максимальное, число Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName ПТ1М Да
Запуски настройки

Число запусков, которые подготавливаются для этой рабочей области. Значение счетчика обновляется, когда запуск ожидает создания или подготовки целевого объекта вычислений.
Provisioning Runs Численность Итог (сумма), среднее, минимальное, максимальное, число Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName ПТ1М Да
Запланированные запуски

Число запусков, которые находятся в очереди для этой рабочей области. Значение счетчика обновляется, когда запуск помещается в очередь целевого объекта вычислений. Может возникнуть при ожидании готовности требуемых вычислительных узлов.
Queued Runs Численность Итог (сумма), среднее, минимальное, максимальное, число Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName ПТ1М Да
Запущенные процессы

Количество прогонов для этой рабочей области. Счёт обновляется, когда процесс запуска начинается на необходимых ресурсах.
Started Runs Численность Итог (сумма), среднее, минимальное, максимальное, число Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName ПТ1М Да
Начало запусков

Количество запусков, начавшихся для этой рабочей области. Значение счетчика обновляется после запроса на создание запуска и заполнения информации о запуске, например идентификатора запуска
Starting Runs Численность Итог (сумма), среднее, минимальное, максимальное, число Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName ПТ1М Да
Предупреждения

Число предупреждений запуска в этой рабочей области. Значение счетчика обновляется каждый раз, когда во время выполнения возникает предупреждение.
Warnings Численность Итог (сумма), среднее, минимальное, максимальное, число Scenario ПТ1М Да

Следующие шаги