Condividi tramite


Metriche supportate per Microsoft.CognitiveServices/accounts

La tabella seguente elenca le metriche disponibili per il tipo di risorsa Microsoft.CognitiveServices/accounts.

Intestazioni di tabella

Metrica: il nome visualizzato della metrica come appare nel portale di Azure.
Nome nell'API REST - Nome della metrica come indicato nell'API REST.
Unità: Unità di misura.
Aggregazione: tipo di aggregazione predefinito. Valori validi: Media, Minimo, Massimo, Totale, Conteggio.
Dimensioni - Dimensioni disponibili per la metrica.
Intervalli di tempo - Intervalli in cui viene campionata la metrica. Ad esempio, PT1M indica che la metrica viene campionata ogni minuto, PT30M ogni 30 minuti, PT1H ogni ora e così via.
Esportazione DS: indica se la metrica è esportabile nei log di Monitoraggio di Azure tramite le impostazioni di diagnostica.

Per informazioni sull'esportazione delle metriche, vedere - Esportazione delle metriche usando le regole di raccolta dati e Creare impostazioni di diagnostica in Monitoraggio di Azure.

Per informazioni sulla conservazione delle metriche, vedere Informazioni generali sulle metriche del Monitoraggio di Azure.

Per un elenco dei log supportati, vedere Categorie di log supportate - Microsoft.CognitiveServices/accounts

Categoria: Azioni

Metrica Nome nell'API REST Unità Aggregazione Dimensioni Intervalli di tempo Esportazione DS
Occorrenze di azioni

Numero di volte in cui viene visualizzata ogni azione.
ActionIdOccurrences Conteggio Totale (somma) ActionId, Mode, RunId PT1M
Azioni per evento

Numero di azioni per evento.
ActionsPerEvent Conteggio Media Mode, RunId PT1M

Categoria: Azure OpenAI - Richieste HTTP

Metrica Nome nell'API REST Unità Aggregazione Dimensioni Intervalli di tempo Esportazione DS
Azure OpenAI Tasso di Disponibilità

Percentuale di disponibilità con il calcolo seguente: (Totale chiamate - Errori del server)/Chiamate totali. Gli errori del server includono tutte le risposte HTTP >=500.
AzureOpenAIAvailabilityRate Percentuale Minimo, Massimo, Medio ApiName, OperationName, Region, StreamTypeModelDeploymentName, , ModelNameModelVersion PT1M NO
Richieste OpenAI di Azure

Numero di chiamate effettuate all'API OpenAI di Azure in un periodo di tempo. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo. Per suddividere le richieste API, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName, ModelVersion, StatusCode (esito positivo, clienterrors, errori del server), StreamType (Streaming e richieste non di streaming) e operazione.
AzureOpenAIRequests Conteggio Totale (somma) ApiName, OperationName, Region, StreamTypeModelDeploymentName, ModelName, , ModelVersionStatusCode PT1M

Categoria: Azure OpenAI - Latenza

Metrica Nome nell'API REST Unità Aggregazione Dimensioni Intervalli di tempo Esportazione DS
Tempo tra token

Per le richieste di streaming; frequenza di generazione dei token del modello, misurata in millisecondi. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo.
AzureOpenAINormalizedTBTInMS Millisecondi Massimo, Minimo, Medio Region, ModelDeploymentName, ModelNameModelVersion PT1M
Tempo normalizzato al primo byte

Per le richieste in streaming e non in streaming; il tempo necessario per ricevere il primo byte di dati di risposta dopo che la richiesta è stata effettuata dal modello, normalizzato tramite token. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo.
AzureOpenAINormalizedTTFTInMS Millisecondi Massimo, Minimo, Medio Region, ModelDeploymentName, ModelNameModelVersion PT1M
Tempo di risposta

Misura di latenza consigliata (velocità di risposta) per le richieste di streaming. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo. Calcolato come tempo impiegato per la comparsa della prima risposta dopo l’invio da parte dell’utente di una richiesta, come misurato dal gateway API. Questo numero aumenta quando le dimensioni delle richieste aumentano e/o si riducono le dimensioni della cache. Per suddividere il tempo per la metrica di risposta, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName e ModelVersion.

Nota: questa metrica è un'approssimazione in quanto latenza misurata dipende in larga misura da più fattori, tra cui chiamate simultanee e modello di carico di lavoro complessivo. Inoltre, non tiene conto di alcuna latenza lato client che può esistere tra il client e l'endpoint API. Per un rilevamento ottimale della latenza, fare riferimento alla registrazione personalizzata.
AzureOpenAITimeToResponse Millisecondi Minimo, Massimo, Medio ApiName, OperationName, Region, StreamTypeModelDeploymentName, ModelName, , ModelVersionStatusCode PT1M
Token al secondo

Enumera la velocità di generazione per una risposta del modello OpenAI di Azure specificata. I token totali generati vengono divisi per il tempo necessario per generare i token, in secondi. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo.
AzureOpenAITokenPerSecond Conteggio Massimo, Minimo, Medio Region, ModelDeploymentName, ModelNameModelVersion PT1M
Time to Last Byte

Per le richieste in streaming e non in streaming; il tempo necessario per ricevere l'ultimo byte di dati di risposta dopo che la richiesta è stata effettuata dal modello. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo.
AzureOpenAITTLTInMS Millisecondi Massimo, Minimo, Medio Region, ModelDeploymentName, ModelNameModelVersion PT1M

Categoria: Azure OpenAI - Utilizzo

Metrica Nome nell'API REST Unità Aggregazione Dimensioni Intervalli di tempo Esportazione DS
Token attivi

Token totali meno token memorizzati nella cache in un intervallo di tempo. Si applica alle distribuzioni PTU e gestite da PTU. Usare questa metrica per comprendere l'utilizzo basato su TPS o TPM per le PTU e confrontare i benchmark per i TPM o TPS di destinazione degli scenari in uso. Per suddividere le richieste API, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName e ModelVersion.
ActiveTokens Conteggio Minimo, Massimo, Media, Totale (Somma) Region, ModelDeploymentName, ModelNameModelVersion PT1M
Token di completamento audio

Numero di token di richiesta audio generati (output) in un modello OpenAI. Si applica alle implementazioni del modello gestite tramite PTU e al modello a pagamento in base al consumo.
AudioCompletionTokens Conteggio Totale (somma) ModelDeploymentName, ModelName, ModelVersionRegion PT1M
Token di richiesta audio

Numero di token di richiesta audio elaborati (input) in un modello OpenAI. Si applica alle implementazioni del modello gestite tramite PTU e al modello a pagamento in base al consumo.
AudioPromptTokens Conteggio Totale (somma) ModelDeploymentName, ModelName, ModelVersionRegion PT1M
Tasso di corrispondenza nella cache dei token di richiesta

Percentuale di token di richiesta con riscontro nella cache. Si applica alle distribuzioni PTU e gestite da PTU.
AzureOpenAIContextTokensCacheMatchRate Percentuale Minimo, Massimo, Medio Region, ModelDeploymentName, ModelNameModelVersion PT1M NO
Utilizzo gestito con provisioning (deprecato)

% di utilizzo per una distribuzione gestita con provisioning, calcolata come (PTU utilizzate/PTU distribuite) x 100. Quando l'utilizzo è maggiore o uguale al 100%, le chiamate vengono limitate e viene restituito il codice di errore 429. Per suddividere questa metrica, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName, ModelVersion e StreamType (streaming e richieste non di streaming)
AzureOpenAIProvisionedManagedUtilization Percentuale Minimo, Massimo, Medio Region, StreamType, ModelDeploymentName, ModelNameModelVersion PT1M NO
Utilizzo gestito con provisioning V2

% di utilizzo per una distribuzione gestita con provisioning, calcolata come (PTU utilizzate/PTU distribuite) x 100. Quando l'utilizzo è maggiore o uguale al 100%, le chiamate vengono limitate e viene restituito il codice di errore 429. Per suddividere questa metrica, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName, ModelVersion e StreamType (streaming e richieste non di streaming)
AzureOpenAIProvisionedManagedUtilizationV2 Percentuale Minimo, Massimo, Medio Region, StreamType, ModelDeploymentName, ModelNameModelVersion PT1M NO
Ore di training ottimizzato elaborate

Numero di ore di training elaborate in un modello ottimizzato di OpenAI
FineTunedTrainingHours Conteggio Totale (somma) ApiName, ModelDeploymentName, FeatureName, UsageChannelRegion PT1M
Token di completamento generati

Numero di token generati (output) da un modello OpenAI. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo. Per suddividere questa metrica, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName e ModelName.
GeneratedTokens Conteggio Totale (somma) ApiName, ModelDeploymentName, FeatureName, UsageChannel, RegionModelVersion PT1M
Token di richiesta elaborati

Numero di token di richiesta elaborati (input) in un modello OpenAI. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo. Per suddividere questa metrica, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName e ModelName.
ProcessedPromptTokens Conteggio Totale (somma) ApiName, ModelDeploymentName, FeatureName, UsageChannel, RegionModelVersion PT1M
Token di inferenza elaborati

Numero di token di inferenza elaborati in un modello OpenAI. Calcolato sommando i token di richiesta (input) e i token generati (output). Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo. Per suddividere questa metrica, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName e ModelName.
TokenTransaction Conteggio Totale (somma) ApiName, ModelDeploymentName, FeatureName, UsageChannel, RegionModelVersion PT1M

Categoria: Servizi cognitivi - Richieste HTTP

Metrica Nome nell'API REST Unità Aggregazione Dimensioni Intervalli di tempo Esportazione DS
Chiamate bloccate

Numero di chiamate che hanno superato il limite di frequenza o di quota. Non usare per il Servizio OpenAI di Azure.
BlockedCalls Conteggio Totale (somma) ApiName, OperationName, RegionRatelimitKey PT1M
Errori del client

Numero di chiamate con errore sul lato client (codice di risposta HTTP 4xx). Non usare per il Servizio OpenAI di Azure.
ClientErrors Conteggio Totale (somma) ApiName, OperationName, RegionRatelimitKey PT1M
Dati in entrata

Dimensione in byte dei dati in entrata. Non usare per il Servizio OpenAI di Azure.
DataIn Byte Totale (somma) ApiName, OperationName, Region PT1M
Dati in uscita

Dimensione in byte dei dati in uscita. Non usare per il Servizio OpenAI di Azure.
DataOut Byte Totale (somma) ApiName, OperationName, Region PT1M
Latenza

Latenza in millisecondi. Non usare per il Servizio OpenAI di Azure.
Latency Millisecondi Media ApiName, OperationName, RegionRatelimitKey PT1M
Ratelimit

Ratelimit corrente della chiave ratelimit. Non usare per il Servizio OpenAI di Azure.
Ratelimit Conteggio Totale (somma) Region, RatelimitKey PT1M
Errori del server

Numero di chiamate con errore interno del servizio (codice di risposta HTTP 5xx). Non usare per il Servizio OpenAI di Azure.
ServerErrors Conteggio Totale (somma) ApiName, OperationName, RegionRatelimitKey PT1M
Chiamate riuscite

Numero di chiamate riuscite. Non usare per il Servizio OpenAI di Azure.
SuccessfulCalls Conteggio Totale (somma) ApiName, OperationName, RegionRatelimitKey PT1M
Totale chiamate

Numero totale di chiamate. Non usare per il Servizio OpenAI di Azure.
TotalCalls Conteggio Totale (somma) ApiName, OperationName, RegionRatelimitKey PT1M
Totale errori

Numero totale di chiamate con risposta di errore (codice di risposta HTTP 4xx o 5xx). Non usare per il Servizio OpenAI di Azure.
TotalErrors Conteggio Totale (somma) ApiName, OperationName, RegionRatelimitKey PT1M
Totale chiamate token

Numero totale di chiamate token.
TotalTokenCalls Conteggio Totale (somma) ApiName, OperationName, Region PT1M

Categoria: Servizi cognitivi - SLI

Metrica Nome nell'API REST Unità Aggregazione Dimensioni Intervalli di tempo Esportazione DS
AvailabilityRate

Percentuale di disponibilità con il calcolo seguente: (Totale chiamate - Errori del server)/Chiamate totali. Gli errori del server includono tutte le risposte HTTP >=500. Non usare per il Servizio OpenAI di Azure.
SuccessRate Percentuale Minimo, Massimo, Medio ApiName, OperationName, RegionRatelimitKey PT1M NO

Categoria: ContentSafety - Rischi&Sicurezza

Metrica Nome nell'API REST Unità Aggregazione Dimensioni Intervalli di tempo Esportazione DS
Conteggio utenti potenzialmente offensivi

Numero di utenti potenzialmente offensivi che hanno rilevato nel corso di un periodo di tempo. È possibile aggiungere un filtro o applicare la suddivisione in base alla dimensione seguente: ModelDeploymentName.
RAIAbusiveUsersCount Conteggio Totale (somma) Region, ModelDeploymentName PT1M
Volume dannoso rilevato

Numero di chiamate effettuate all'API OpenAI di Azure e rilevate come dannose (sia il modello di blocco che la modalità di annotazione) da parte del filtro contenuto applicato per un periodo di tempo. È possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName e TextType.
RAIHarmfulRequests Conteggio Totale (somma) Region, ModelDeploymentName, ModelName, ModelVersionApiName, TextType, , CategorySeverity PT1M
Volume bloccato

Numero di chiamate effettuate all'API OpenAI di Azure e rifiutate dal filtro contenuto applicato per un periodo di tempo. È possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName e TextType.
RAIRejectedRequests Conteggio Totale (somma) Region, ModelDeploymentName, ModelName, ModelVersionApiName, , TextTypeCategory PT1M
Evento del sistema di sicurezza

Evento di sistema per i rischi e il monitoraggio della sicurezza. È possibile aggiungere un filtro o applicare la suddivisione in base alla dimensione seguente: EventType.
RAISystemEvent Conteggio Media Region, EventType PT1M
Volume totale inviato per il controllo della sicurezza

Numero di chiamate effettuate all'API OpenAI di Azure e rilevate dal filtro del contenuto applicato per un periodo di tempo. È possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName.
RAITotalRequests Conteggio Totale (somma) Region, ModelDeploymentName, ModelName, ModelVersionApiName PT1M

Categoria: Sicurezza dei Contenuti - Utilizzo

Metrica Nome nell'API REST Unità Aggregazione Dimensioni Intervalli di tempo Esportazione DS
Conteggio chiamate per moderazione immagini

Numero di chiamate per la moderazione delle immagini.
ContentSafetyImageAnalyzeRequestCount Conteggio Totale (somma) ApiVersion PT1M
Conteggio chiamate per moderazione testo

Numero di chiamate per la moderazione del testo.
ContentSafetyTextAnalyzeRequestCount Conteggio Totale (somma) ApiVersion PT1M

Categoria: stime

Metrica Nome nell'API REST Unità Aggregazione Dimensioni Intervalli di tempo Esportazione DS
Conteggio eventi casuali di base

Stima per il numero di eventi casuali di base.
BaselineRandomEventCount Conteggio Totale (somma) Mode, RunId PT1M
Ricompensa casuale di base

Stima della ricompensa casuale di base.
BaselineRandomReward Conteggio Totale (somma) Mode, RunId PT1M
Conteggio eventi online

Stima del numero di eventi online.
OnlineEventCount Conteggio Totale (somma) Mode, RunId PT1M
Premio online

Stima della ricompensa online.
OnlineReward Conteggio Totale (somma) Mode, RunId PT1M
Conteggio eventi di base utente

Stima per il conteggio degli eventi di base definiti dall'utente.
UserBaselineEventCount Conteggio Totale (somma) Mode, RunId PT1M
Ricompensa base dell'utente

Stima per la ricompensa di base definita dall'utente.
UserBaselineReward Conteggio Totale (somma) Mode, RunId PT1M

Categoria: occorrenze delle funzionalità

Metrica Nome nell'API REST Unità Aggregazione Dimensioni Intervalli di tempo Esportazione DS
Occorrenze delle funzionalità di azione

Numero di volte in cui viene visualizzata ogni funzionalità di azione.
ActionFeatureIdOccurrences Conteggio Totale (somma) FeatureId, Mode, RunId PT1M
Occorrenze delle funzionalità di contesto

Numero di volte in cui viene visualizzata ogni funzionalità di contesto.
ContextFeatureIdOccurrences Conteggio Totale (somma) FeatureId, Mode, RunId PT1M
Occorrenze delle funzionalità di slot

Numero di volte in cui viene visualizzata ogni funzionalità dello slot.
SlotFeatureIdOccurrences Conteggio Totale (somma) FeatureId, Mode, RunId PT1M

Categoria: cardinalità delle funzionalità

Metrica Nome nell'API REST Unità Aggregazione Dimensioni Intervalli di tempo Esportazione DS
Cardinalità delle funzionalità in base all'azione

Cardinalità delle funzionalità in base all'azione.
FeatureCardinality_Action Conteggio Media FeatureId, Mode, RunId PT1M
Cardinalità delle funzionalità in base al contesto

Cardinalità delle funzionalità in base al contesto.
FeatureCardinality_Context Conteggio Media FeatureId, Mode, RunId PT1M
Cardinalità delle funzionalità in base allo slot

Cardinalità delle funzionalità in base allo slot.
FeatureCardinality_Slot Conteggio Media FeatureId, Mode, RunId PT1M

Categoria: funzionalità per evento

Metrica Nome nell'API REST Unità Aggregazione Dimensioni Intervalli di tempo Esportazione DS
Funzionalità di azione per evento

Numero medio di funzionalità di azione per evento.
ActionFeaturesPerEvent Conteggio Media Mode, RunId PT1M
Caratteristiche del contesto per evento

Numero di funzionalità di contesto per evento.
ContextFeaturesPerEvent Conteggio Media Mode, RunId PT1M
Funzionalità di slot per evento

Numero medio di funzionalità di slot per evento.
SlotFeaturesPerEvent Conteggio Media Mode, RunId PT1M

Categoria: Lingua - Lavori

Metrica Nome nell'API REST Unità Aggregazione Dimensioni Intervalli di tempo Esportazione DS
Durata processo (anteprima)

Nota: questo valore dipende principalmente dalle dimensioni di input, dal numero di documenti e dalla complessità dell'attività. Si tratta di un valore aggregato in tutte le attività del processo.
JobDuration Millisecondi Minimo, Massimo, Medio JobStatus, JobType PT1M

Categoria: Modelli - Richieste HTTP

Metrica Nome nell'API REST Unità Aggregazione Dimensioni Intervalli di tempo Esportazione DS
Frequenza di disponibilità del modello

Percentuale di disponibilità con il calcolo seguente: (Totale chiamate - Errori del server)/Chiamate totali. Gli errori del server includono tutte le risposte HTTP >=500.
ModelAvailabilityRate Percentuale Minimo, Massimo, Medio Region, ModelDeploymentName, ModelNameModelVersion PT1M NO
Richieste di modello

Numero di chiamate effettuate all'API del modello in un periodo di tempo. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo.
ModelRequests Conteggio Totale (somma) ApiName, OperationName, Region, StreamTypeModelDeploymentName, ModelName, , ModelVersionStatusCode PT1M

Categoria: Modelli - Latenza

Metrica Nome nell'API REST Unità Aggregazione Dimensioni Intervalli di tempo Esportazione DS
Intervallo di Tempo tra i Token

Per le richieste di streaming; Frequenza di generazione dei token del modello, misurata in millisecondi. Si applica alle distribuzioni PTU e gestite da PTU.
NormalizedTimeBetweenTokens Millisecondi Massimo, Minimo, Medio ApiName, OperationName, Region, StreamTypeModelDeploymentName, , ModelNameModelVersion PT1M
Tempo normalizzato al primo byte

Per le richieste in streaming e non in streaming; il tempo necessario per ricevere il primo byte di dati di risposta dopo che la richiesta è stata effettuata dal modello, normalizzato tramite token. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo.
NormalizedTimeToFirstToken Millisecondi Massimo, Minimo, Medio ApiName, OperationName, Region, StreamTypeModelDeploymentName, , ModelNameModelVersion PT1M
Time to Last Byte

Per le richieste in streaming e non in streaming; il tempo necessario per ricevere l'ultimo byte di dati di risposta dopo che la richiesta è stata effettuata dal modello. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo.
TimeToLastByte Millisecondi Massimo, Minimo, Medio ApiName, OperationName, Region, StreamTypeModelDeploymentName, , ModelNameModelVersion PT1M
Tempo di risposta

Misura di latenza consigliata (velocità di risposta) per le richieste di streaming. Si applica alle distribuzioni PTU e gestite da PTU. Calcolato come tempo impiegato per la comparsa della prima risposta dopo l’invio da parte dell’utente di una richiesta, come misurato dal gateway API. Questo numero aumenta quando le dimensioni delle richieste aumentano e/o si riducono le dimensioni della cache. Per suddividere il tempo per la metrica di risposta, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName e ModelVersion.

Nota: questa metrica è un'approssimazione in quanto latenza misurata dipende in larga misura da più fattori, tra cui chiamate simultanee e modello di carico di lavoro complessivo. Inoltre, non tiene conto di alcuna latenza lato client che può esistere tra il client e l'endpoint API. Per un rilevamento ottimale della latenza, fare riferimento alla registrazione personalizzata.
TimeToResponse Millisecondi Minimo, Massimo, Medio ApiName, OperationName, Region, StreamTypeModelDeploymentName, ModelName, , ModelVersionStatusCode PT1M
Token al secondo

Enumera la velocità di generazione per una determinata risposta del modello. I token totali generati vengono divisi per il tempo necessario per generare i token, in secondi. Si applica alle distribuzioni PTU e gestite da PTU.
TokensPerSecond Conteggio Massimo, Minimo, Medio ApiName, OperationName, Region, StreamTypeModelDeploymentName, , ModelNameModelVersion PT1M

Categoria: Modelli - Utilizzo

Metrica Nome nell'API REST Unità Aggregazione Dimensioni Intervalli di tempo Esportazione DS
Token di input

Numero di token di richiesta elaborati (input) su un modello. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo.
InputTokens Conteggio Totale (somma) ApiName, Region, ModelDeploymentName, ModelNameModelVersion PT1M
Token di uscita

Numero di token generati (output) da un modello OpenAI. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo.
OutputTokens Conteggio Totale (somma) ApiName, Region, ModelDeploymentName, ModelNameModelVersion PT1M
Utilizzo assegnato

% di utilizzo per una distribuzione gestita con provisioning, calcolata come (PTU utilizzate/PTU distribuite) x 100. Quando l'utilizzo è maggiore o uguale al 100%, le chiamate vengono limitate e viene restituito il codice di errore 429.
ProvisionedUtilization Percentuale Minimo, Massimo, Medio Region, ModelDeploymentName, ModelNameModelVersion PT1M NO
Totale token

Numero di token di inferenza elaborati in un modello. Calcolato sommando i token di richiesta (input) e i token generati (output). Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo.
TotalTokens Conteggio Totale (somma) ApiName, Region, ModelDeploymentName, ModelNameModelVersion PT1M

Categoria: spazi dei nomi per evento

Metrica Nome nell'API REST Unità Aggregazione Dimensioni Intervalli di tempo Esportazione DS
Spazi dei nomi delle azioni per evento

Numero medio di namespace di azioni per evento.
ActionNamespacesPerEvent Conteggio Media Mode, RunId PT1M
Spazi dei nomi di contesto per evento

Numero di spazi dei nomi di contesto per evento.
ContextNamespacesPerEvent Conteggio Media Mode, RunId PT1M
Spazi dei nomi degli slot per evento

Numero medio di spazi dei nomi degli slot per evento.
SlotNamespacesPerEvent Conteggio Media Mode, RunId PT1M

Categoria: Premi

Metrica Nome nell'API REST Unità Aggregazione Dimensioni Intervalli di tempo Esportazione DS
Ricompensa media per evento

Ricompensa media per evento.
Reward Conteggio Media BaselineAction, ChosenActionId, MatchesBaseline, NonDefaultReward, ModeRunId PT1M
Premio slot

Ricompensa per posizione.
SlotReward Conteggio Media BaselineActionId, ChosenActionId, MatchesBaseline, NonDefaultRewardSlotId, SlotIndex, , ModeRunId PT1M

Categoria: slot

Metrica Nome nell'API REST Unità Aggregazione Dimensioni Intervalli di tempo Esportazione DS
Ricompensa complessiva dello stimatore della linea di base

Ricompensa complessiva dell'estimatore di base.
BaselineEstimatorOverallReward Conteggio Media Mode, RunId PT1M
Premio slot dello strumento di stima di base

Premio dello strumento di stima di base per slot.
BaselineEstimatorSlotReward Conteggio Media SlotId, SlotIndex, ModeRunId PT1M
Stimatore casuale di base Ricompensa complessiva

Ricompensa complessiva dello stimatore casuale di base.
BaselineRandomEstimatorOverallReward Conteggio Media Mode, RunId PT1M
Premio slot dello strumento di stima casuale di base

Premio dello strumento di stima casuale di base per slot.
BaselineRandomEstimatorSlotReward Conteggio Media SlotId, SlotIndex, ModeRunId PT1M
Slot

Numero di slot per evento.
NumberOfSlots Conteggio Media Mode, RunId PT1M
Ricompensa complessiva del valutatore online

Premio complessivo dello strumento di stima online.
OnlineEstimatorOverallReward Conteggio Media Mode, RunId PT1M
Premio slot dello strumento di stima online

Premio dello strumento di stima online per slot.
OnlineEstimatorSlotReward Conteggio Media SlotId, SlotIndex, ModeRunId PT1M
Occorrenze di slot

Numero di volte in cui viene visualizzato ogni slot.
SlotIdOccurrences Conteggio Totale (somma) SlotId, SlotIndex, ModeRunId PT1M

Categoria: SpeechServices - Utilizzo

Metrica Nome nell'API REST Unità Aggregazione Dimensioni Intervalli di tempo Esportazione DS
Secondi audio trascritti

Numero di secondi trascritti
AudioSecondsTranscribed Conteggio Totale (somma) ApiName, FeatureName, UsageChannelRegion PT1M
Secondi audio tradotti

Numero di secondi tradotti
AudioSecondsTranslated Conteggio Totale (somma) ApiName, FeatureName, UsageChannelRegion PT1M
Secondi di hosting del modello avatar

Numero di secondi.
AvatarModelHostingSeconds Conteggio Totale (somma) ApiName, FeatureName, UsageChannelRegion PT1M
Secondi di addestramento del modello Avatar

Numero di secondi.
AvatarModelTrainingSeconds Conteggio Totale (somma) ApiName, FeatureName, UsageChannelRegion PT1M
Numero di profili degli speaker

Numero di profili voce registrati. Ripartizione oraria.
NumberofSpeakerProfiles Conteggio Totale (somma) ApiName, FeatureName, UsageChannelRegion PT1M
Transazioni di riconoscimento del parlante

Numero di transazioni di riconoscimento voce
SpeakerRecognitionTransactions Conteggio Totale (somma) ApiName, FeatureName, UsageChannelRegion PT1M
Ore di hosting del modello di riconoscimento vocale

Numero di ore di hosting del modello di riconoscimento vocale
SpeechModelHostingHours Conteggio Totale (somma) ApiName, FeatureName, UsageChannelRegion PT1M
Caratteri sintetizzati

Numero di caratteri.
SynthesizedCharacters Conteggio Totale (somma) ApiName, FeatureName, UsageChannelRegion PT1M
Secondi video sintetizzati

Numero di secondi sintetizzati
VideoSecondsSynthesized Conteggio Totale (somma) ApiName, FeatureName, UsageChannelRegion PT1M
Ore di hosting del modello vocale

Numero di ore.
VoiceModelHostingHours Conteggio Totale (somma) ApiName, FeatureName, UsageChannelRegion PT1M
Minuti di addestramento del modello vocale

Numero di minuti.
VoiceModelTrainingMinutes Conteggio Totale (somma) ApiName, FeatureName, UsageChannelRegion PT1M

Categoria: Uso

Metrica Nome nell'API REST Unità Aggregazione Dimensioni Intervalli di tempo Esportazione DS
Conteggio inferenze

Conteggio delle inferenze del servizio Carnegie Frontdoor
CarnegieInferenceCount Conteggio Totale (somma) Region, Modality, Category, Language, SeverityLevelUseCustomList PT1M
Caratteri sottoposti a training (deprecato)

Numero totale di caratteri sottoposti a training.
CharactersTrained Conteggio Totale (somma) ApiName, OperationName, Region PT1M
Caratteri tradotti (obsoleto)

Numero totale di caratteri nella richiesta di testo in ingresso.
CharactersTranslated Conteggio Totale (somma) ApiName, OperationName, Region PT1M
Transazioni di Visione Artificiale

Numero delle transazioni di visione artificiale
ComputerVisionTransactions Conteggio Totale (somma) ApiName, FeatureName, UsageChannelRegion PT1M
Tempo di training di Visione personalizzata

Tempo di addestramento di Custom Vision
CustomVisionTrainingTime Secondi Totale (somma) ApiName, FeatureName, UsageChannelRegion PT1M
Transazioni di Visione personalizzata

Numero di transazioni di previsione di Visione personalizzata
CustomVisionTransactions Conteggio Totale (somma) ApiName, FeatureName, UsageChannelRegion PT1M
Caratteri documento tradotti

Numero di caratteri nella richiesta di traduzione dei documenti.
DocumentCharactersTranslated Conteggio Totale (somma) ApiName, FeatureName, UsageChannelRegion PT1M
Caratteri personalizzati del documento tradotti

Numero di caratteri nella richiesta di traduzione documenti personalizzata.
DocumentCustomCharactersTranslated Conteggio Totale (somma) ApiName, FeatureName, UsageChannelRegion PT1M
Immagini del viso sottoposte a training

Numero di immagini sottoposte a training. 1.000 immagini sottoposte a training per transazione.
FaceImagesTrained Conteggio Totale (somma) ApiName, FeatureName, UsageChannelRegion PT1M
Visi archiviati

Numero di volti archiviati, proporzionato giornalmente. Il numero di visi archiviati viene segnalato ogni giorno.
FacesStored Conteggio Totale (somma) ApiName, FeatureName, UsageChannelRegion PT1M
Transazioni viso

Numero di chiamate API effettuate al servizio Face
FaceTransactions Conteggio Totale (somma) ApiName, FeatureName, UsageChannelRegion PT1M
Immagini archiviate

Numero di immagini Visione personalizzata archiviate.
ImagesStored Conteggio Totale (somma) ApiName, FeatureName, UsageChannelRegion PT1M
Eventi analizzati

Numero di eventi analizzati.
LearnedEvents Conteggio Totale (somma) IsMatchBaseline, Mode, RunId PT1M
Richieste di riconoscimento vocale LUIS

Numero di richieste di riconoscimento finalità voce LUIS
LUISSpeechRequests Conteggio Totale (somma) ApiName, FeatureName, UsageChannelRegion PT1M
Richieste di testo LUIS

Numero di richieste di testo LUIS
LUISTextRequests Conteggio Totale (somma) ApiName, FeatureName, UsageChannelRegion PT1M
Premi corrispondenti

Numero di ricompense abbinate.
MatchedRewards Conteggio Totale (somma) Mode, RunId PT1M
Eventi non attivati

Numero di eventi saltati.
NonActivatedEvents Conteggio Totale (somma) Mode, RunId PT1M
Ricompense osservate

Numero di ricompense osservate.
ObservedRewards Conteggio Totale (somma) Mode, RunId PT1M
Caratteri di sincronizzazione documenti tradotti

Numero di caratteri nella richiesta di traduzione dei documenti (sincrona).
OneDocumentCharactersTranslated Conteggio Totale (somma) ApiName, FeatureName, UsageChannelRegion PT1M
Caratteri personalizzati di sincronizzazione documenti tradotti

Numero di caratteri nella richiesta di traduzione documento personalizzata (sincrona).
OneDocumentCustomCharactersTranslated Conteggio Totale (somma) ApiName, FeatureName, UsageChannelRegion PT1M
Caratteri elaborati

Numero di caratteri elaborati da Strumento di lettura immersiva.
ProcessedCharacters Conteggio Totale (somma) ApiName, FeatureName, UsageChannelRegion PT1M
Record di testo per la salute elaborati

Numero di record di testo per la salute elaborati
ProcessedHealthTextRecords Conteggio Totale (somma) ApiName, FeatureName, UsageChannelRegion PT1M
Immagini elaborate

Numero di immagini elaborate
ProcessedImages Conteggio Totale (somma) ApiName, FeatureName, UsageChannelRegion PT1M
Pagine elaborate

Numero di pagine elaborate
ProcessedPages Conteggio Totale (somma) ApiName, FeatureName, UsageChannelRegion PT1M
Record di testo elaborati

Conteggio dei record di testo.
ProcessedTextRecords Conteggio Totale (somma) ApiName, FeatureName, UsageChannelRegion PT1M
Record di testo QA

Numero di record di testo elaborati
QuestionAnsweringTextRecords Conteggio Totale (somma) ApiName, FeatureName, UsageChannelRegion PT1M
Durata della sessione vocale (obsoleta)

Durata totale della sessione vocale in secondi.
SpeechSessionDuration Secondi Totale (somma) ApiName, OperationName, Region PT1M
Caratteri di testo tradotti

Numero di caratteri nella richiesta di traduzione testuale in ingresso.
TextCharactersTranslated Conteggio Totale (somma) ApiName, FeatureName, UsageChannelRegion PT1M
Caratteri personalizzati di testo tradotti

Numero di caratteri nella richiesta di traduzione di testo personalizzata in ingresso.
TextCustomCharactersTranslated Conteggio Totale (somma) ApiName, FeatureName, UsageChannelRegion PT1M
Caratteri sottoposti a training del testo

Numero di caratteri sottoposti a training usando la traduzione testuale.
TextTrainedCharacters Conteggio Totale (somma) ApiName, FeatureName, UsageChannelRegion PT1M
Totale eventi

Numero di eventi.
TotalEvents Conteggio Totale (somma) Mode, RunId PT1M
Totale transazioni (deprecato)

Numero totale di transazioni.
TotalTransactions Conteggio Totale (somma) <nessuno> PT1M
Secondi nell'app Translator Pro

Numero di secondi di utilizzo di Translator Pro App.
TranslatorProAppSeconds Secondi Totale (somma) ApiName, FeatureName, UsageChannelRegion PT1M

Passaggi successivi