Metriche supportate per Microsoft.CognitiveServices/accounts

2025-06-05

La tabella seguente elenca le metriche disponibili per il tipo di risorsa Microsoft.CognitiveServices/accounts.

Intestazioni di tabella

Metrica: il nome visualizzato della metrica come appare nel portale di Azure.
Nome nell'API REST - Nome della metrica come indicato nell'API REST.
Unità: Unità di misura.
Aggregazione: tipo di aggregazione predefinito. Valori validi: Media, Minimo, Massimo, Totale, Conteggio.
Dimensioni - Dimensioni disponibili per la metrica.
Intervalli di tempo - Intervalli in cui viene campionata la metrica. Ad esempio, PT1M indica che la metrica viene campionata ogni minuto, PT30M ogni 30 minuti, PT1H ogni ora e così via.
Esportazione DS: indica se la metrica è esportabile nei log di Monitoraggio di Azure tramite le impostazioni di diagnostica.

Per informazioni sull'esportazione delle metriche, vedere - Esportazione delle metriche usando le regole di raccolta dati e Creare impostazioni di diagnostica in Monitoraggio di Azure.

Per informazioni sulla conservazione delle metriche, vedere Informazioni generali sulle metriche del Monitoraggio di Azure.

Per un elenco dei log supportati, vedere Categorie di log supportate - Microsoft.CognitiveServices/accounts

Categoria: Azioni

Metrica	Nome nell'API REST	Unità	Aggregazione	Dimensioni	Intervalli di tempo	Esportazione DS
Occorrenze di azioni Numero di volte in cui viene visualizzata ogni azione.	`ActionIdOccurrences`	Conteggio	Totale (somma)	`ActionId`, `Mode`, `RunId`	PT1M	Sì
Azioni per evento Numero di azioni per evento.	`ActionsPerEvent`	Conteggio	Media	`Mode`, `RunId`	PT1M	Sì

Categoria: Azure OpenAI - Richieste HTTP

Metrica	Nome nell'API REST	Unità	Aggregazione	Dimensioni	Intervalli di tempo	Esportazione DS
Azure OpenAI Tasso di Disponibilità Percentuale di disponibilità con il calcolo seguente: (Totale chiamate - Errori del server)/Chiamate totali. Gli errori del server includono tutte le risposte HTTP >=500.	`AzureOpenAIAvailabilityRate`	Percentuale	Minimo, Massimo, Medio	`ApiName`, `OperationName`, `Region`, `StreamTypeModelDeploymentName`, , `ModelNameModelVersion`	PT1M	NO
Richieste OpenAI di Azure Numero di chiamate effettuate all'API OpenAI di Azure in un periodo di tempo. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo. Per suddividere le richieste API, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName, ModelVersion, StatusCode (esito positivo, clienterrors, errori del server), StreamType (Streaming e richieste non di streaming) e operazione.	`AzureOpenAIRequests`	Conteggio	Totale (somma)	`ApiName`, `OperationName`, `Region`, `StreamTypeModelDeploymentName`, `ModelName`, , `ModelVersionStatusCode`	PT1M	Sì

Categoria: Azure OpenAI - Latenza

Metrica	Nome nell'API REST	Unità	Aggregazione	Dimensioni	Intervalli di tempo	Esportazione DS
Tempo tra token Per le richieste di streaming; frequenza di generazione dei token del modello, misurata in millisecondi. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo.	`AzureOpenAINormalizedTBTInMS`	Millisecondi	Massimo, Minimo, Medio	`Region`, `ModelDeploymentName`, `ModelNameModelVersion`	PT1M	Sì
Tempo normalizzato al primo byte Per le richieste in streaming e non in streaming; il tempo necessario per ricevere il primo byte di dati di risposta dopo che la richiesta è stata effettuata dal modello, normalizzato tramite token. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo.	`AzureOpenAINormalizedTTFTInMS`	Millisecondi	Massimo, Minimo, Medio	`Region`, `ModelDeploymentName`, `ModelNameModelVersion`	PT1M	Sì
Tempo di risposta Misura di latenza consigliata (velocità di risposta) per le richieste di streaming. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo. Calcolato come tempo impiegato per la comparsa della prima risposta dopo l’invio da parte dell’utente di una richiesta, come misurato dal gateway API. Questo numero aumenta quando le dimensioni delle richieste aumentano e/o si riducono le dimensioni della cache. Per suddividere il tempo per la metrica di risposta, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName e ModelVersion. Nota: questa metrica è un'approssimazione in quanto latenza misurata dipende in larga misura da più fattori, tra cui chiamate simultanee e modello di carico di lavoro complessivo. Inoltre, non tiene conto di alcuna latenza lato client che può esistere tra il client e l'endpoint API. Per un rilevamento ottimale della latenza, fare riferimento alla registrazione personalizzata.	`AzureOpenAITimeToResponse`	Millisecondi	Minimo, Massimo, Medio	`ApiName`, `OperationName`, `Region`, `StreamTypeModelDeploymentName`, `ModelName`, , `ModelVersionStatusCode`	PT1M	Sì
Token al secondo Enumera la velocità di generazione per una risposta del modello OpenAI di Azure specificata. I token totali generati vengono divisi per il tempo necessario per generare i token, in secondi. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo.	`AzureOpenAITokenPerSecond`	Conteggio	Massimo, Minimo, Medio	`Region`, `ModelDeploymentName`, `ModelNameModelVersion`	PT1M	Sì
Time to Last Byte Per le richieste in streaming e non in streaming; il tempo necessario per ricevere l'ultimo byte di dati di risposta dopo che la richiesta è stata effettuata dal modello. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo.	`AzureOpenAITTLTInMS`	Millisecondi	Massimo, Minimo, Medio	`Region`, `ModelDeploymentName`, `ModelNameModelVersion`	PT1M	Sì

Categoria: Azure OpenAI - Utilizzo

Metrica	Nome nell'API REST	Unità	Aggregazione	Dimensioni	Intervalli di tempo	Esportazione DS
Token attivi Token totali meno token memorizzati nella cache in un intervallo di tempo. Si applica alle distribuzioni PTU e gestite da PTU. Usare questa metrica per comprendere l'utilizzo basato su TPS o TPM per le PTU e confrontare i benchmark per i TPM o TPS di destinazione degli scenari in uso. Per suddividere le richieste API, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName e ModelVersion.	`ActiveTokens`	Conteggio	Minimo, Massimo, Media, Totale (Somma)	`Region`, `ModelDeploymentName`, `ModelNameModelVersion`	PT1M	Sì
Token di completamento audio Numero di token di richiesta audio generati (output) in un modello OpenAI. Si applica alle implementazioni del modello gestite tramite PTU e al modello a pagamento in base al consumo.	`AudioCompletionTokens`	Conteggio	Totale (somma)	`ModelDeploymentName`, `ModelName`, `ModelVersionRegion`	PT1M	Sì
Token di richiesta audio Numero di token di richiesta audio elaborati (input) in un modello OpenAI. Si applica alle implementazioni del modello gestite tramite PTU e al modello a pagamento in base al consumo.	`AudioPromptTokens`	Conteggio	Totale (somma)	`ModelDeploymentName`, `ModelName`, `ModelVersionRegion`	PT1M	Sì
Tasso di corrispondenza nella cache dei token di richiesta Percentuale di token di richiesta con riscontro nella cache. Si applica alle distribuzioni PTU e gestite da PTU.	`AzureOpenAIContextTokensCacheMatchRate`	Percentuale	Minimo, Massimo, Medio	`Region`, `ModelDeploymentName`, `ModelNameModelVersion`	PT1M	NO
Utilizzo gestito con provisioning (deprecato) % di utilizzo per una distribuzione gestita con provisioning, calcolata come (PTU utilizzate/PTU distribuite) x 100. Quando l'utilizzo è maggiore o uguale al 100%, le chiamate vengono limitate e viene restituito il codice di errore 429. Per suddividere questa metrica, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName, ModelVersion e StreamType (streaming e richieste non di streaming)	`AzureOpenAIProvisionedManagedUtilization`	Percentuale	Minimo, Massimo, Medio	`Region`, `StreamType`, `ModelDeploymentName`, `ModelNameModelVersion`	PT1M	NO
Utilizzo gestito con provisioning V2 % di utilizzo per una distribuzione gestita con provisioning, calcolata come (PTU utilizzate/PTU distribuite) x 100. Quando l'utilizzo è maggiore o uguale al 100%, le chiamate vengono limitate e viene restituito il codice di errore 429. Per suddividere questa metrica, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName, ModelVersion e StreamType (streaming e richieste non di streaming)	`AzureOpenAIProvisionedManagedUtilizationV2`	Percentuale	Minimo, Massimo, Medio	`Region`, `StreamType`, `ModelDeploymentName`, `ModelNameModelVersion`	PT1M	NO
Ore di training ottimizzato elaborate Numero di ore di training elaborate in un modello ottimizzato di OpenAI	`FineTunedTrainingHours`	Conteggio	Totale (somma)	`ApiName`, `ModelDeploymentName`, `FeatureName`, `UsageChannelRegion`	PT1M	Sì
Token di completamento generati Numero di token generati (output) da un modello OpenAI. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo. Per suddividere questa metrica, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName e ModelName.	`GeneratedTokens`	Conteggio	Totale (somma)	`ApiName`, `ModelDeploymentName`, `FeatureName`, `UsageChannel`, `RegionModelVersion`	PT1M	Sì
Token di richiesta elaborati Numero di token di richiesta elaborati (input) in un modello OpenAI. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo. Per suddividere questa metrica, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName e ModelName.	`ProcessedPromptTokens`	Conteggio	Totale (somma)	`ApiName`, `ModelDeploymentName`, `FeatureName`, `UsageChannel`, `RegionModelVersion`	PT1M	Sì
Token di inferenza elaborati Numero di token di inferenza elaborati in un modello OpenAI. Calcolato sommando i token di richiesta (input) e i token generati (output). Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo. Per suddividere questa metrica, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName e ModelName.	`TokenTransaction`	Conteggio	Totale (somma)	`ApiName`, `ModelDeploymentName`, `FeatureName`, `UsageChannel`, `RegionModelVersion`	PT1M	Sì

Categoria: Servizi cognitivi - Richieste HTTP

Metrica	Nome nell'API REST	Unità	Aggregazione	Dimensioni	Intervalli di tempo	Esportazione DS
Chiamate bloccate Numero di chiamate che hanno superato il limite di frequenza o di quota. Non usare per il Servizio OpenAI di Azure.	`BlockedCalls`	Conteggio	Totale (somma)	`ApiName`, `OperationName`, `RegionRatelimitKey`	PT1M	Sì
Errori del client Numero di chiamate con errore sul lato client (codice di risposta HTTP 4xx). Non usare per il Servizio OpenAI di Azure.	`ClientErrors`	Conteggio	Totale (somma)	`ApiName`, `OperationName`, `RegionRatelimitKey`	PT1M	Sì
Dati in entrata Dimensione in byte dei dati in entrata. Non usare per il Servizio OpenAI di Azure.	`DataIn`	Byte	Totale (somma)	`ApiName`, `OperationName`, `Region`	PT1M	Sì
Dati in uscita Dimensione in byte dei dati in uscita. Non usare per il Servizio OpenAI di Azure.	`DataOut`	Byte	Totale (somma)	`ApiName`, `OperationName`, `Region`	PT1M	Sì
Latenza Latenza in millisecondi. Non usare per il Servizio OpenAI di Azure.	`Latency`	Millisecondi	Media	`ApiName`, `OperationName`, `RegionRatelimitKey`	PT1M	Sì
Ratelimit Ratelimit corrente della chiave ratelimit. Non usare per il Servizio OpenAI di Azure.	`Ratelimit`	Conteggio	Totale (somma)	`Region`, `RatelimitKey`	PT1M	Sì
Errori del server Numero di chiamate con errore interno del servizio (codice di risposta HTTP 5xx). Non usare per il Servizio OpenAI di Azure.	`ServerErrors`	Conteggio	Totale (somma)	`ApiName`, `OperationName`, `RegionRatelimitKey`	PT1M	Sì
Chiamate riuscite Numero di chiamate riuscite. Non usare per il Servizio OpenAI di Azure.	`SuccessfulCalls`	Conteggio	Totale (somma)	`ApiName`, `OperationName`, `RegionRatelimitKey`	PT1M	Sì
Totale chiamate Numero totale di chiamate. Non usare per il Servizio OpenAI di Azure.	`TotalCalls`	Conteggio	Totale (somma)	`ApiName`, `OperationName`, `RegionRatelimitKey`	PT1M	Sì
Totale errori Numero totale di chiamate con risposta di errore (codice di risposta HTTP 4xx o 5xx). Non usare per il Servizio OpenAI di Azure.	`TotalErrors`	Conteggio	Totale (somma)	`ApiName`, `OperationName`, `RegionRatelimitKey`	PT1M	Sì
Totale chiamate token Numero totale di chiamate token.	`TotalTokenCalls`	Conteggio	Totale (somma)	`ApiName`, `OperationName`, `Region`	PT1M	Sì

Categoria: Servizi cognitivi - SLI

Metrica	Nome nell'API REST	Unità	Aggregazione	Dimensioni	Intervalli di tempo	Esportazione DS
AvailabilityRate Percentuale di disponibilità con il calcolo seguente: (Totale chiamate - Errori del server)/Chiamate totali. Gli errori del server includono tutte le risposte HTTP >=500. Non usare per il Servizio OpenAI di Azure.	`SuccessRate`	Percentuale	Minimo, Massimo, Medio	`ApiName`, `OperationName`, `RegionRatelimitKey`	PT1M	NO

Categoria: ContentSafety - Rischi&Sicurezza

Metrica	Nome nell'API REST	Unità	Aggregazione	Dimensioni	Intervalli di tempo	Esportazione DS
Conteggio utenti potenzialmente offensivi Numero di utenti potenzialmente offensivi che hanno rilevato nel corso di un periodo di tempo. È possibile aggiungere un filtro o applicare la suddivisione in base alla dimensione seguente: ModelDeploymentName.	`RAIAbusiveUsersCount`	Conteggio	Totale (somma)	`Region`, `ModelDeploymentName`	PT1M	Sì
Volume dannoso rilevato Numero di chiamate effettuate all'API OpenAI di Azure e rilevate come dannose (sia il modello di blocco che la modalità di annotazione) da parte del filtro contenuto applicato per un periodo di tempo. È possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName e TextType.	`RAIHarmfulRequests`	Conteggio	Totale (somma)	`Region`, `ModelDeploymentName`, `ModelName`, `ModelVersionApiName`, `TextType`, , `CategorySeverity`	PT1M	Sì
Volume bloccato Numero di chiamate effettuate all'API OpenAI di Azure e rifiutate dal filtro contenuto applicato per un periodo di tempo. È possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName e TextType.	`RAIRejectedRequests`	Conteggio	Totale (somma)	`Region`, `ModelDeploymentName`, `ModelName`, `ModelVersionApiName`, , `TextTypeCategory`	PT1M	Sì
Evento del sistema di sicurezza Evento di sistema per i rischi e il monitoraggio della sicurezza. È possibile aggiungere un filtro o applicare la suddivisione in base alla dimensione seguente: EventType.	`RAISystemEvent`	Conteggio	Media	`Region`, `EventType`	PT1M	Sì
Volume totale inviato per il controllo della sicurezza Numero di chiamate effettuate all'API OpenAI di Azure e rilevate dal filtro del contenuto applicato per un periodo di tempo. È possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName.	`RAITotalRequests`	Conteggio	Totale (somma)	`Region`, `ModelDeploymentName`, `ModelName`, `ModelVersionApiName`	PT1M	Sì

Categoria: Sicurezza dei Contenuti - Utilizzo

Metrica	Nome nell'API REST	Unità	Aggregazione	Dimensioni	Intervalli di tempo	Esportazione DS
Conteggio chiamate per moderazione immagini Numero di chiamate per la moderazione delle immagini.	`ContentSafetyImageAnalyzeRequestCount`	Conteggio	Totale (somma)	`ApiVersion`	PT1M	Sì
Conteggio chiamate per moderazione testo Numero di chiamate per la moderazione del testo.	`ContentSafetyTextAnalyzeRequestCount`	Conteggio	Totale (somma)	`ApiVersion`	PT1M	Sì

Categoria: stime

Metrica	Nome nell'API REST	Unità	Aggregazione	Dimensioni	Intervalli di tempo	Esportazione DS
Conteggio eventi casuali di base Stima per il numero di eventi casuali di base.	`BaselineRandomEventCount`	Conteggio	Totale (somma)	`Mode`, `RunId`	PT1M	Sì
Ricompensa casuale di base Stima della ricompensa casuale di base.	`BaselineRandomReward`	Conteggio	Totale (somma)	`Mode`, `RunId`	PT1M	Sì
Conteggio eventi online Stima del numero di eventi online.	`OnlineEventCount`	Conteggio	Totale (somma)	`Mode`, `RunId`	PT1M	Sì
Premio online Stima della ricompensa online.	`OnlineReward`	Conteggio	Totale (somma)	`Mode`, `RunId`	PT1M	Sì
Conteggio eventi di base utente Stima per il conteggio degli eventi di base definiti dall'utente.	`UserBaselineEventCount`	Conteggio	Totale (somma)	`Mode`, `RunId`	PT1M	Sì
Ricompensa base dell'utente Stima per la ricompensa di base definita dall'utente.	`UserBaselineReward`	Conteggio	Totale (somma)	`Mode`, `RunId`	PT1M	Sì

Categoria: occorrenze delle funzionalità

Metrica	Nome nell'API REST	Unità	Aggregazione	Dimensioni	Intervalli di tempo	Esportazione DS
Occorrenze delle funzionalità di azione Numero di volte in cui viene visualizzata ogni funzionalità di azione.	`ActionFeatureIdOccurrences`	Conteggio	Totale (somma)	`FeatureId`, `Mode`, `RunId`	PT1M	Sì
Occorrenze delle funzionalità di contesto Numero di volte in cui viene visualizzata ogni funzionalità di contesto.	`ContextFeatureIdOccurrences`	Conteggio	Totale (somma)	`FeatureId`, `Mode`, `RunId`	PT1M	Sì
Occorrenze delle funzionalità di slot Numero di volte in cui viene visualizzata ogni funzionalità dello slot.	`SlotFeatureIdOccurrences`	Conteggio	Totale (somma)	`FeatureId`, `Mode`, `RunId`	PT1M	Sì

Categoria: cardinalità delle funzionalità

Metrica	Nome nell'API REST	Unità	Aggregazione	Dimensioni	Intervalli di tempo	Esportazione DS
Cardinalità delle funzionalità in base all'azione Cardinalità delle funzionalità in base all'azione.	`FeatureCardinality_Action`	Conteggio	Media	`FeatureId`, `Mode`, `RunId`	PT1M	Sì
Cardinalità delle funzionalità in base al contesto Cardinalità delle funzionalità in base al contesto.	`FeatureCardinality_Context`	Conteggio	Media	`FeatureId`, `Mode`, `RunId`	PT1M	Sì
Cardinalità delle funzionalità in base allo slot Cardinalità delle funzionalità in base allo slot.	`FeatureCardinality_Slot`	Conteggio	Media	`FeatureId`, `Mode`, `RunId`	PT1M	Sì

Categoria: funzionalità per evento

Metrica	Nome nell'API REST	Unità	Aggregazione	Dimensioni	Intervalli di tempo	Esportazione DS
Funzionalità di azione per evento Numero medio di funzionalità di azione per evento.	`ActionFeaturesPerEvent`	Conteggio	Media	`Mode`, `RunId`	PT1M	Sì
Caratteristiche del contesto per evento Numero di funzionalità di contesto per evento.	`ContextFeaturesPerEvent`	Conteggio	Media	`Mode`, `RunId`	PT1M	Sì
Funzionalità di slot per evento Numero medio di funzionalità di slot per evento.	`SlotFeaturesPerEvent`	Conteggio	Media	`Mode`, `RunId`	PT1M	Sì

Categoria: Lingua - Lavori

Metrica	Nome nell'API REST	Unità	Aggregazione	Dimensioni	Intervalli di tempo	Esportazione DS
Durata processo (anteprima) Nota: questo valore dipende principalmente dalle dimensioni di input, dal numero di documenti e dalla complessità dell'attività. Si tratta di un valore aggregato in tutte le attività del processo.	`JobDuration`	Millisecondi	Minimo, Massimo, Medio	`JobStatus`, `JobType`	PT1M	Sì

Categoria: Modelli - Richieste HTTP

Metrica	Nome nell'API REST	Unità	Aggregazione	Dimensioni	Intervalli di tempo	Esportazione DS
Frequenza di disponibilità del modello Percentuale di disponibilità con il calcolo seguente: (Totale chiamate - Errori del server)/Chiamate totali. Gli errori del server includono tutte le risposte HTTP >=500.	`ModelAvailabilityRate`	Percentuale	Minimo, Massimo, Medio	`Region`, `ModelDeploymentName`, `ModelNameModelVersion`	PT1M	NO
Richieste di modello Numero di chiamate effettuate all'API del modello in un periodo di tempo. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo.	`ModelRequests`	Conteggio	Totale (somma)	`ApiName`, `OperationName`, `Region`, `StreamTypeModelDeploymentName`, `ModelName`, , `ModelVersionStatusCode`	PT1M	Sì

Categoria: Modelli - Latenza

Metrica	Nome nell'API REST	Unità	Aggregazione	Dimensioni	Intervalli di tempo	Esportazione DS
Intervallo di Tempo tra i Token Per le richieste di streaming; Frequenza di generazione dei token del modello, misurata in millisecondi. Si applica alle distribuzioni PTU e gestite da PTU.	`NormalizedTimeBetweenTokens`	Millisecondi	Massimo, Minimo, Medio	`ApiName`, `OperationName`, `Region`, `StreamTypeModelDeploymentName`, , `ModelNameModelVersion`	PT1M	Sì
Tempo normalizzato al primo byte Per le richieste in streaming e non in streaming; il tempo necessario per ricevere il primo byte di dati di risposta dopo che la richiesta è stata effettuata dal modello, normalizzato tramite token. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo.	`NormalizedTimeToFirstToken`	Millisecondi	Massimo, Minimo, Medio	`ApiName`, `OperationName`, `Region`, `StreamTypeModelDeploymentName`, , `ModelNameModelVersion`	PT1M	Sì
Time to Last Byte Per le richieste in streaming e non in streaming; il tempo necessario per ricevere l'ultimo byte di dati di risposta dopo che la richiesta è stata effettuata dal modello. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo.	`TimeToLastByte`	Millisecondi	Massimo, Minimo, Medio	`ApiName`, `OperationName`, `Region`, `StreamTypeModelDeploymentName`, , `ModelNameModelVersion`	PT1M	Sì
Tempo di risposta Misura di latenza consigliata (velocità di risposta) per le richieste di streaming. Si applica alle distribuzioni PTU e gestite da PTU. Calcolato come tempo impiegato per la comparsa della prima risposta dopo l’invio da parte dell’utente di una richiesta, come misurato dal gateway API. Questo numero aumenta quando le dimensioni delle richieste aumentano e/o si riducono le dimensioni della cache. Per suddividere il tempo per la metrica di risposta, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName e ModelVersion. Nota: questa metrica è un'approssimazione in quanto latenza misurata dipende in larga misura da più fattori, tra cui chiamate simultanee e modello di carico di lavoro complessivo. Inoltre, non tiene conto di alcuna latenza lato client che può esistere tra il client e l'endpoint API. Per un rilevamento ottimale della latenza, fare riferimento alla registrazione personalizzata.	`TimeToResponse`	Millisecondi	Minimo, Massimo, Medio	`ApiName`, `OperationName`, `Region`, `StreamTypeModelDeploymentName`, `ModelName`, , `ModelVersionStatusCode`	PT1M	Sì
Token al secondo Enumera la velocità di generazione per una determinata risposta del modello. I token totali generati vengono divisi per il tempo necessario per generare i token, in secondi. Si applica alle distribuzioni PTU e gestite da PTU.	`TokensPerSecond`	Conteggio	Massimo, Minimo, Medio	`ApiName`, `OperationName`, `Region`, `StreamTypeModelDeploymentName`, , `ModelNameModelVersion`	PT1M	Sì

Categoria: Modelli - Utilizzo

Metrica	Nome nell'API REST	Unità	Aggregazione	Dimensioni	Intervalli di tempo	Esportazione DS
Token di input Numero di token di richiesta elaborati (input) su un modello. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo.	`InputTokens`	Conteggio	Totale (somma)	`ApiName`, `Region`, `ModelDeploymentName`, `ModelNameModelVersion`	PT1M	Sì
Token di uscita Numero di token generati (output) da un modello OpenAI. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo.	`OutputTokens`	Conteggio	Totale (somma)	`ApiName`, `Region`, `ModelDeploymentName`, `ModelNameModelVersion`	PT1M	Sì
Utilizzo assegnato % di utilizzo per una distribuzione gestita con provisioning, calcolata come (PTU utilizzate/PTU distribuite) x 100. Quando l'utilizzo è maggiore o uguale al 100%, le chiamate vengono limitate e viene restituito il codice di errore 429.	`ProvisionedUtilization`	Percentuale	Minimo, Massimo, Medio	`Region`, `ModelDeploymentName`, `ModelNameModelVersion`	PT1M	NO
Totale token Numero di token di inferenza elaborati in un modello. Calcolato sommando i token di richiesta (input) e i token generati (output). Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo.	`TotalTokens`	Conteggio	Totale (somma)	`ApiName`, `Region`, `ModelDeploymentName`, `ModelNameModelVersion`	PT1M	Sì

Categoria: spazi dei nomi per evento

Metrica	Nome nell'API REST	Unità	Aggregazione	Dimensioni	Intervalli di tempo	Esportazione DS
Spazi dei nomi delle azioni per evento Numero medio di namespace di azioni per evento.	`ActionNamespacesPerEvent`	Conteggio	Media	`Mode`, `RunId`	PT1M	Sì
Spazi dei nomi di contesto per evento Numero di spazi dei nomi di contesto per evento.	`ContextNamespacesPerEvent`	Conteggio	Media	`Mode`, `RunId`	PT1M	Sì
Spazi dei nomi degli slot per evento Numero medio di spazi dei nomi degli slot per evento.	`SlotNamespacesPerEvent`	Conteggio	Media	`Mode`, `RunId`	PT1M	Sì

Categoria: Premi

Metrica	Nome nell'API REST	Unità	Aggregazione	Dimensioni	Intervalli di tempo	Esportazione DS
Ricompensa media per evento Ricompensa media per evento.	`Reward`	Conteggio	Media	`BaselineAction`, `ChosenActionId`, `MatchesBaseline`, `NonDefaultReward`, `ModeRunId`	PT1M	Sì
Premio slot Ricompensa per posizione.	`SlotReward`	Conteggio	Media	`BaselineActionId`, `ChosenActionId`, `MatchesBaseline`, `NonDefaultRewardSlotId`, `SlotIndex`, , `ModeRunId`	PT1M	Sì

Categoria: slot

Metrica	Nome nell'API REST	Unità	Aggregazione	Dimensioni	Intervalli di tempo	Esportazione DS
Ricompensa complessiva dello stimatore della linea di base Ricompensa complessiva dell'estimatore di base.	`BaselineEstimatorOverallReward`	Conteggio	Media	`Mode`, `RunId`	PT1M	Sì
Premio slot dello strumento di stima di base Premio dello strumento di stima di base per slot.	`BaselineEstimatorSlotReward`	Conteggio	Media	`SlotId`, `SlotIndex`, `ModeRunId`	PT1M	Sì
Stimatore casuale di base Ricompensa complessiva Ricompensa complessiva dello stimatore casuale di base.	`BaselineRandomEstimatorOverallReward`	Conteggio	Media	`Mode`, `RunId`	PT1M	Sì
Premio slot dello strumento di stima casuale di base Premio dello strumento di stima casuale di base per slot.	`BaselineRandomEstimatorSlotReward`	Conteggio	Media	`SlotId`, `SlotIndex`, `ModeRunId`	PT1M	Sì
Slot Numero di slot per evento.	`NumberOfSlots`	Conteggio	Media	`Mode`, `RunId`	PT1M	Sì
Ricompensa complessiva del valutatore online Premio complessivo dello strumento di stima online.	`OnlineEstimatorOverallReward`	Conteggio	Media	`Mode`, `RunId`	PT1M	Sì
Premio slot dello strumento di stima online Premio dello strumento di stima online per slot.	`OnlineEstimatorSlotReward`	Conteggio	Media	`SlotId`, `SlotIndex`, `ModeRunId`	PT1M	Sì
Occorrenze di slot Numero di volte in cui viene visualizzato ogni slot.	`SlotIdOccurrences`	Conteggio	Totale (somma)	`SlotId`, `SlotIndex`, `ModeRunId`	PT1M	Sì

Categoria: SpeechServices - Utilizzo

Metrica	Nome nell'API REST	Unità	Aggregazione	Dimensioni	Intervalli di tempo	Esportazione DS
Secondi audio trascritti Numero di secondi trascritti	`AudioSecondsTranscribed`	Conteggio	Totale (somma)	`ApiName`, `FeatureName`, `UsageChannelRegion`	PT1M	Sì
Secondi audio tradotti Numero di secondi tradotti	`AudioSecondsTranslated`	Conteggio	Totale (somma)	`ApiName`, `FeatureName`, `UsageChannelRegion`	PT1M	Sì
Secondi di hosting del modello avatar Numero di secondi.	`AvatarModelHostingSeconds`	Conteggio	Totale (somma)	`ApiName`, `FeatureName`, `UsageChannelRegion`	PT1M	Sì
Secondi di addestramento del modello Avatar Numero di secondi.	`AvatarModelTrainingSeconds`	Conteggio	Totale (somma)	`ApiName`, `FeatureName`, `UsageChannelRegion`	PT1M	Sì
Numero di profili degli speaker Numero di profili voce registrati. Ripartizione oraria.	`NumberofSpeakerProfiles`	Conteggio	Totale (somma)	`ApiName`, `FeatureName`, `UsageChannelRegion`	PT1M	Sì
Transazioni di riconoscimento del parlante Numero di transazioni di riconoscimento voce	`SpeakerRecognitionTransactions`	Conteggio	Totale (somma)	`ApiName`, `FeatureName`, `UsageChannelRegion`	PT1M	Sì
Ore di hosting del modello di riconoscimento vocale Numero di ore di hosting del modello di riconoscimento vocale	`SpeechModelHostingHours`	Conteggio	Totale (somma)	`ApiName`, `FeatureName`, `UsageChannelRegion`	PT1M	Sì
Caratteri sintetizzati Numero di caratteri.	`SynthesizedCharacters`	Conteggio	Totale (somma)	`ApiName`, `FeatureName`, `UsageChannelRegion`	PT1M	Sì
Secondi video sintetizzati Numero di secondi sintetizzati	`VideoSecondsSynthesized`	Conteggio	Totale (somma)	`ApiName`, `FeatureName`, `UsageChannelRegion`	PT1M	Sì
Ore di hosting del modello vocale Numero di ore.	`VoiceModelHostingHours`	Conteggio	Totale (somma)	`ApiName`, `FeatureName`, `UsageChannelRegion`	PT1M	Sì
Minuti di addestramento del modello vocale Numero di minuti.	`VoiceModelTrainingMinutes`	Conteggio	Totale (somma)	`ApiName`, `FeatureName`, `UsageChannelRegion`	PT1M	Sì

Categoria: Uso

Metrica	Nome nell'API REST	Unità	Aggregazione	Dimensioni	Intervalli di tempo	Esportazione DS
Conteggio inferenze Conteggio delle inferenze del servizio Carnegie Frontdoor	`CarnegieInferenceCount`	Conteggio	Totale (somma)	`Region`, `Modality`, `Category`, `Language`, `SeverityLevelUseCustomList`	PT1M	Sì
Caratteri sottoposti a training (deprecato) Numero totale di caratteri sottoposti a training.	`CharactersTrained`	Conteggio	Totale (somma)	`ApiName`, `OperationName`, `Region`	PT1M	Sì
Caratteri tradotti (obsoleto) Numero totale di caratteri nella richiesta di testo in ingresso.	`CharactersTranslated`	Conteggio	Totale (somma)	`ApiName`, `OperationName`, `Region`	PT1M	Sì
Transazioni di Visione Artificiale Numero delle transazioni di visione artificiale	`ComputerVisionTransactions`	Conteggio	Totale (somma)	`ApiName`, `FeatureName`, `UsageChannelRegion`	PT1M	Sì
Tempo di training di Visione personalizzata Tempo di addestramento di Custom Vision	`CustomVisionTrainingTime`	Secondi	Totale (somma)	`ApiName`, `FeatureName`, `UsageChannelRegion`	PT1M	Sì
Transazioni di Visione personalizzata Numero di transazioni di previsione di Visione personalizzata	`CustomVisionTransactions`	Conteggio	Totale (somma)	`ApiName`, `FeatureName`, `UsageChannelRegion`	PT1M	Sì
Caratteri documento tradotti Numero di caratteri nella richiesta di traduzione dei documenti.	`DocumentCharactersTranslated`	Conteggio	Totale (somma)	`ApiName`, `FeatureName`, `UsageChannelRegion`	PT1M	Sì
Caratteri personalizzati del documento tradotti Numero di caratteri nella richiesta di traduzione documenti personalizzata.	`DocumentCustomCharactersTranslated`	Conteggio	Totale (somma)	`ApiName`, `FeatureName`, `UsageChannelRegion`	PT1M	Sì
Immagini del viso sottoposte a training Numero di immagini sottoposte a training. 1.000 immagini sottoposte a training per transazione.	`FaceImagesTrained`	Conteggio	Totale (somma)	`ApiName`, `FeatureName`, `UsageChannelRegion`	PT1M	Sì
Visi archiviati Numero di volti archiviati, proporzionato giornalmente. Il numero di visi archiviati viene segnalato ogni giorno.	`FacesStored`	Conteggio	Totale (somma)	`ApiName`, `FeatureName`, `UsageChannelRegion`	PT1M	Sì
Transazioni viso Numero di chiamate API effettuate al servizio Face	`FaceTransactions`	Conteggio	Totale (somma)	`ApiName`, `FeatureName`, `UsageChannelRegion`	PT1M	Sì
Immagini archiviate Numero di immagini Visione personalizzata archiviate.	`ImagesStored`	Conteggio	Totale (somma)	`ApiName`, `FeatureName`, `UsageChannelRegion`	PT1M	Sì
Eventi analizzati Numero di eventi analizzati.	`LearnedEvents`	Conteggio	Totale (somma)	`IsMatchBaseline`, `Mode`, `RunId`	PT1M	Sì
Richieste di riconoscimento vocale LUIS Numero di richieste di riconoscimento finalità voce LUIS	`LUISSpeechRequests`	Conteggio	Totale (somma)	`ApiName`, `FeatureName`, `UsageChannelRegion`	PT1M	Sì
Richieste di testo LUIS Numero di richieste di testo LUIS	`LUISTextRequests`	Conteggio	Totale (somma)	`ApiName`, `FeatureName`, `UsageChannelRegion`	PT1M	Sì
Premi corrispondenti Numero di ricompense abbinate.	`MatchedRewards`	Conteggio	Totale (somma)	`Mode`, `RunId`	PT1M	Sì
Eventi non attivati Numero di eventi saltati.	`NonActivatedEvents`	Conteggio	Totale (somma)	`Mode`, `RunId`	PT1M	Sì
Ricompense osservate Numero di ricompense osservate.	`ObservedRewards`	Conteggio	Totale (somma)	`Mode`, `RunId`	PT1M	Sì
Caratteri di sincronizzazione documenti tradotti Numero di caratteri nella richiesta di traduzione dei documenti (sincrona).	`OneDocumentCharactersTranslated`	Conteggio	Totale (somma)	`ApiName`, `FeatureName`, `UsageChannelRegion`	PT1M	Sì
Caratteri personalizzati di sincronizzazione documenti tradotti Numero di caratteri nella richiesta di traduzione documento personalizzata (sincrona).	`OneDocumentCustomCharactersTranslated`	Conteggio	Totale (somma)	`ApiName`, `FeatureName`, `UsageChannelRegion`	PT1M	Sì
Caratteri elaborati Numero di caratteri elaborati da Strumento di lettura immersiva.	`ProcessedCharacters`	Conteggio	Totale (somma)	`ApiName`, `FeatureName`, `UsageChannelRegion`	PT1M	Sì
Record di testo per la salute elaborati Numero di record di testo per la salute elaborati	`ProcessedHealthTextRecords`	Conteggio	Totale (somma)	`ApiName`, `FeatureName`, `UsageChannelRegion`	PT1M	Sì
Immagini elaborate Numero di immagini elaborate	`ProcessedImages`	Conteggio	Totale (somma)	`ApiName`, `FeatureName`, `UsageChannelRegion`	PT1M	Sì
Pagine elaborate Numero di pagine elaborate	`ProcessedPages`	Conteggio	Totale (somma)	`ApiName`, `FeatureName`, `UsageChannelRegion`	PT1M	Sì
Record di testo elaborati Conteggio dei record di testo.	`ProcessedTextRecords`	Conteggio	Totale (somma)	`ApiName`, `FeatureName`, `UsageChannelRegion`	PT1M	Sì
Record di testo QA Numero di record di testo elaborati	`QuestionAnsweringTextRecords`	Conteggio	Totale (somma)	`ApiName`, `FeatureName`, `UsageChannelRegion`	PT1M	Sì
Durata della sessione vocale (obsoleta) Durata totale della sessione vocale in secondi.	`SpeechSessionDuration`	Secondi	Totale (somma)	`ApiName`, `OperationName`, `Region`	PT1M	Sì
Caratteri di testo tradotti Numero di caratteri nella richiesta di traduzione testuale in ingresso.	`TextCharactersTranslated`	Conteggio	Totale (somma)	`ApiName`, `FeatureName`, `UsageChannelRegion`	PT1M	Sì
Caratteri personalizzati di testo tradotti Numero di caratteri nella richiesta di traduzione di testo personalizzata in ingresso.	`TextCustomCharactersTranslated`	Conteggio	Totale (somma)	`ApiName`, `FeatureName`, `UsageChannelRegion`	PT1M	Sì
Caratteri sottoposti a training del testo Numero di caratteri sottoposti a training usando la traduzione testuale.	`TextTrainedCharacters`	Conteggio	Totale (somma)	`ApiName`, `FeatureName`, `UsageChannelRegion`	PT1M	Sì
Totale eventi Numero di eventi.	`TotalEvents`	Conteggio	Totale (somma)	`Mode`, `RunId`	PT1M	Sì
Totale transazioni (deprecato) Numero totale di transazioni.	`TotalTransactions`	Conteggio	Totale (somma)	<nessuno>	PT1M	Sì
Secondi nell'app Translator Pro Numero di secondi di utilizzo di Translator Pro App.	`TranslatorProAppSeconds`	Secondi	Totale (somma)	`ApiName`, `FeatureName`, `UsageChannelRegion`	PT1M	Sì