Поддерживаемые метрики для Microsoft.CognitiveServices/accounts/projects

В следующей таблице перечислены метрики, доступные для типа ресурса Microsoft.CognitiveServices/accounts/projects.

Заголовки таблиц

Metric - Название метрики, как оно отображается в портале Azure. Name in Rest API - Название метрики, упоминаемой в REST API. Единица измерения. Аггрегация - Тип агрегации по умолчанию. Допустимые значения: Среднее, Минимум, Максимум, Сумма, Количество. Измерения - Размеры, доступные для данной метрики. Гранулы времени - Интервалы, на которых выполняется выборка метрики. Например, PT1M указывает, что метрика измеряется каждую минуту, PT30M — каждые 30 минут, PT1H — каждый час и так далее. DS Export - Можно ли экспортировать метрику в Azure Monitor Logs через диагностические настройки.

Для получения информации об экспорте метрик см. Экспорт метрик с использованием правил сбора данных и Создание диагностических настроек в Azure Monitor.

Сведения о хранении метрик вы можете найти в разделе Обзор метрик Azure Monitor.

Список поддерживаемых журналов см. в разделе "Поддерживаемые категории журналов" — Microsoft.CognitiveServices/accounts/projects

Категория: агенты ИИ

Единица измерения	Название в REST API	Единица	Aggregation	Измерения	Гранулы времени	Экспорт данных (DS)
События агента (предварительная версия) Количество событий для агентов ИИ в этом проекте.	`AgentEvents`	Численность	Count, Total (Sum), Average, Maximum, Minimum	`EventType`	ПТ1М	нет
Маркеры ввода агента (предварительная версия) Количество входных маркеров для агентов ИИ в этом проекте.	`AgentInputTokens`	Численность	Общее (сумма), среднее, максимальное, минимальное	`AgentId` `ModelName` `TokenType`	ПТ1М	нет
Сообщения пользователя агента (предварительная версия) Количество событий для сообщений пользователя агента ИИ в этом проекте.	`AgentMessages`	Численность	Count, Total (Sum), Average, Maximum, Minimum	`EventType`, `ThreadId`	ПТ1М	нет
Маркеры вывода агента (предварительная версия) Количество выходных маркеров для агентов ИИ в этом проекте.	`AgentOutputTokens`	Численность	Общее (сумма), среднее, максимальное, минимальное	`AgentId` `ModelName` `TokenType`	ПТ1М	нет
Ответы агента (предварительная версия) Количество ответов агентами ИИ в этом проекте.	`AgentResponses`	Численность	Count, Total (Sum), Average, Maximum, Minimum	`AgentId` `ModelName` `ResponseStatus`	ПТ1М	нет
Запуски агента (предварительная версия) Количество запусков агентами ИИ в этом проекте.	`AgentRuns`	Численность	Count, Total (Sum), Average, Maximum, Minimum	`AgentId` `ModelName` `RunStatus` `StatusCode` `ThreadId` `StreamType`	ПТ1М	нет
Потоки агента (предварительная версия) Количество событий для потоков агента ИИ в этом проекте.	`AgentThreads`	Численность	Count, Total (Sum), Average, Maximum, Minimum	`EventType`	ПТ1М	нет
Вызовы средств агента (предварительная версия) Количество вызовов инструментов, выполненных агентами ИИ в этом проекте.	`AgentToolCalls`	Численность	Count, Total (Sum), Average, Maximum, Minimum	`AgentId` `ModelName` `ToolName`	ПТ1М	нет
Индексированные файлы агента (предварительная версия) Количество файлов, индексированных для использования агента ИИ, например получения в этом проекте.	`AgentUsageIndexedFiles`	Численность	Count, Total (Sum), Average, Maximum, Minimum	`ErrorCode` `Status` `VectorStoreId`	ПТ1М	нет

Категория: модели — HTTP-запросы

Единица измерения	Название в REST API	Единица	Aggregation	Измерения	Гранулы времени	Экспорт данных (DS)
Частота доступности модели Процент доступности со следующим вычислением: (Общее число вызовов — ошибки сервера)/Всего вызовов. Ошибки сервера включают все HTTP-ответы >=500.	`ModelAvailabilityRate`	Процент	Минимальное, максимальное, среднее	`Region` `ModelDeploymentName` `ModelName` `ModelVersion`	ПТ1М	нет
Запросы модели Количество вызовов, выполненных в API модели за период времени. Применяется к развертываниям PTU, PTU-Managed and Pay-as-go.	`ModelRequests`	Численность	Сумма (Итог)	`ApiName`, `OperationName`, `RegionStreamTypeModelDeploymentNameModelNameModelVersionStatusCode`	ПТ1М	Да

Категория: Модели: Задержка

Единица измерения	Название в REST API	Единица	Aggregation	Измерения	Гранулы времени	Экспорт данных (DS)
Время между маркерами Для потоковых запросов; Скорость создания маркеров модели, измеряемая в миллисекундах. Применяется к PTU и управляемым PTU развертываниям.	`NormalizedTimeBetweenTokens`	Миллисекунды	Максимальное, минимальное, среднее	`ApiName`, `OperationName`, `RegionStreamTypeModelDeploymentNameModelNameModelVersion`	ПТ1М	Да
Нормализованное время до первого байта Для потоковых и непотоковых запросов; время, необходимое для получения первого байта данных ответа после выполнения запроса моделью, нормализованного по токену. Применяется к развертываниям PTU, управляемым PTU, и развертываниям с оплатой по факту использования.	`NormalizedTimeToFirstToken`	Миллисекунды	Максимальное, минимальное, среднее	`ApiName`, `OperationName`, `RegionStreamTypeModelDeploymentNameModelNameModelVersion`	ПТ1М	Да
Время последнего байта Для потоковых и непотоковых запросов; время, необходимое для получения последних байтов данных ответа после выполнения запроса моделью. Применяется к развертываниям PTU, управляемым PTU, и развертываниям с оплатой по факту использования.	`TimeToLastByte`	Миллисекунды	Максимальное, минимальное, среднее	`ApiName`, `OperationName`, `RegionStreamTypeModelDeploymentNameModelNameModelVersion`	ПТ1М	Да
Время отклика Рекомендуемая мера задержки (скорость отклика) для потоковых запросов. Применяется к PTU и управляемым PTU развертываниям. Вычисляется как время, затраченное на первый ответ после отправки пользователем запроса, как измеряется шлюзом API. Это число увеличивается при увеличении размера запроса и/или уменьшении объема кэширования. Для разбивки времени для метрики ответа можно добавить фильтр или применить разделение по следующим измерениям: ModelDeploymentName, ModelName и ModelVersion. Примечание. Эта метрика является приблизительной, так как измеряемая задержка сильно зависит от нескольких факторов, включая одновременные вызовы и общий шаблон рабочей нагрузки. Кроме того, она не учитывает задержку на стороне клиента, которая может существовать между клиентом и конечной точкой API. Обратитесь к вашему собственному журналу для оптимального отслеживания временных задержек.	`TimeToResponse`	Миллисекунды	Минимальное, максимальное, среднее	`ApiName`, `OperationName`, `RegionStreamTypeModelDeploymentNameModelNameModelVersionStatusCode`	ПТ1М	Да
Токены в секунду Перечисляет скорость генерации ответа для заданной модели. Общее количество созданных маркеров делится на время создания маркеров в секундах. Применяется к PTU и управляемым PTU развертываниям.	`TokensPerSecond`	Численность	Максимальное, минимальное, среднее	`ApiName`, `OperationName`, `RegionStreamTypeModelDeploymentNameModelNameModelVersion`	ПТ1М	Да

Категория: модели — использование

Единица измерения	Название в REST API	Единица	Aggregation	Измерения	Гранулы времени	Экспорт данных (DS)
Маркеры ввода звука Количество токенов аудиозапроса (вход) обработанных моделью OpenAI. Применяется к развертываниям управляемых PTU моделей.	`AudioInputTokens`	Численность	Сумма (Итог)	`ModelDeploymentName` `ModelName` `ModelVersion` `Region`	ПТ1М	Да
Маркеры вывода звука Количество токенов аудиоподсказок, сгенерированных (в качестве выходных данных) моделью OpenAI. Применяется к развертываниям управляемых PTU моделей.	`AudioOutputTokens`	Численность	Сумма (Итог)	`ModelDeploymentName` `ModelName` `ModelVersion` `Region`	ПТ1М	Да
Входные токены Количество входных токенов запроса, обработанных моделью. Применяется к развертываниям PTU, PTU-Managed and Pay-as-go.	`InputTokens`	Численность	Сумма (Итог)	`ApiName`, , `RegionModelDeploymentName`, `ModelNameModelVersion`	ПТ1М	Да
Выходные маркеры Количество маркеров, созданных (выходные данные) из модели OpenAI. Применяется к развертываниям PTU, PTU-Managed and Pay-as-go.	`OutputTokens`	Численность	Сумма (Итог)	`ApiName`, , `RegionModelDeploymentName`, `ModelNameModelVersion`	ПТ1М	Да
Подготовленное использование Уровень использования для управляемого и предварительно развернутого развертывания, вычисляется как (использованные PTU / развернутые PTU) x 100. Если использование больше или равно 100%, вызовы регулируются и возвращаются код ошибки 429.	`ProvisionedUtilization`	Процент	Минимальное, максимальное, среднее	`Region` `ModelDeploymentName` `ModelName` `ModelVersion`	ПТ1М	нет
Всего маркеров Количество маркеров вывода, обработанных в модели. Вычисляется как токены запроса (входные данные) плюс сгенерированные токены (выходные данные). Применяется к развертываниям PTU, PTU-Managed and Pay-as-go.	`TotalTokens`	Численность	Сумма (Итог)	`ApiName`, , `RegionModelDeploymentName`, `ModelNameModelVersion`	ПТ1М	Да

Категория: общие ресурсы

Единица измерения	Название в REST API	Единица	Aggregation	Измерения	Гранулы времени	Экспорт данных (DS)
Потребляемые единицы запросов Cosmos DB (предварительная версия) Общее количество единиц запросов (ЕЗ), потребляемых для Cosmos DB на каждый проект. Единица выставления счетов для пропускной способности Cosmos DB — сопоставляется с 70-90% затрат на Cosmos DB.	`CosmosDbRequestUnits`	Численность	Общее (сумма), среднее, максимальное, минимальное	`DatabaseName`, `ContainerName`	ПТ1М	нет
Регулирование запросов Cosmos DB (предварительная версия) Число запросов Cosmos DB, регулируемых (HTTP 429) на каждый проект. Указывает состязание по общей пропускной способности для планирования емкости.	`CosmosDbThrottledRequests`	Численность	Count, Total (Sum), Average, Maximum, Minimum	`DatabaseName`, `ContainerName`	ПТ1М	нет
Запросы на получение поиска (предварительная версия) Количество запросов на получение поиска, сделанных по Поиск с использованием ИИ Azure для каждой базы знаний в этом проекте. Прокси-сервер для использования вычислительных ресурсов поиска (использование реплики).	`SearchRetrievalRequests`	Численность	Count, Total (Sum), Average, Maximum, Minimum	`ResourceType`, `IndexName`	ПТ1М	нет
Поиск хранилища на базу знаний (предварительная версия) Хранилище, используемое каждой базой знаний в общем Поиск с использованием ИИ Azure индексе. Основное измерение выставления счетов — затраты на использование секций.	`SearchStoragePerKnowledgeBase`	Bytes	Среднее, максимальное, минимальное	`IndexName`	ПТ1М	нет

Дальнейшие шаги

Обратная связь

Были ли сведения на этой странице полезными?

Last updated on 2026-04-28