Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
La tabella seguente elenca le metriche disponibili per il tipo di risorsa Microsoft.CognitiveServices/accounts.
Intestazioni di tabella
Metrica: il nome visualizzato della metrica come appare nel portale di Azure.
Nome nell'API REST - Nome della metrica come indicato nell'API REST.
Unità: Unità di misura.
Aggregazione: tipo di aggregazione predefinito. Valori validi: Media, Minimo, Massimo, Totale, Conteggio.
Dimensioni - Dimensioni disponibili per la metrica.
Intervalli di tempo - Intervalli in cui viene campionata la metrica. Ad esempio, PT1M
indica che la metrica viene campionata ogni minuto, PT30M
ogni 30 minuti, PT1H
ogni ora e così via.
Esportazione DS: indica se la metrica è esportabile nei log di Monitoraggio di Azure tramite le impostazioni di diagnostica.
Per informazioni sull'esportazione delle metriche, vedere - Esportazione delle metriche usando le regole di raccolta dati e Creare impostazioni di diagnostica in Monitoraggio di Azure.
Per informazioni sulla conservazione delle metriche, vedere Informazioni generali sulle metriche del Monitoraggio di Azure.
Per un elenco dei log supportati, vedere Categorie di log supportate - Microsoft.CognitiveServices/accounts
Categoria: Azioni
Metrica | Nome nell'API REST | Unità | Aggregazione | Dimensioni | Intervalli di tempo | Esportazione DS |
---|---|---|---|---|---|---|
Occorrenze di azioni Numero di volte in cui viene visualizzata ogni azione. |
ActionIdOccurrences |
Conteggio | Totale (somma) |
ActionId , Mode , RunId |
PT1M | Sì |
Azioni per evento Numero di azioni per evento. |
ActionsPerEvent |
Conteggio | Media |
Mode , RunId |
PT1M | Sì |
Categoria: Azure OpenAI - Richieste HTTP
Metrica | Nome nell'API REST | Unità | Aggregazione | Dimensioni | Intervalli di tempo | Esportazione DS |
---|---|---|---|---|---|---|
Azure OpenAI Tasso di Disponibilità Percentuale di disponibilità con il calcolo seguente: (Totale chiamate - Errori del server)/Chiamate totali. Gli errori del server includono tutte le risposte HTTP >=500. |
AzureOpenAIAvailabilityRate |
Percentuale | Minimo, Massimo, Medio |
ApiName , OperationName , Region , StreamType ModelDeploymentName , , ModelName ModelVersion |
PT1M | NO |
Richieste OpenAI di Azure Numero di chiamate effettuate all'API OpenAI di Azure in un periodo di tempo. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo. Per suddividere le richieste API, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName, ModelVersion, StatusCode (esito positivo, clienterrors, errori del server), StreamType (Streaming e richieste non di streaming) e operazione. |
AzureOpenAIRequests |
Conteggio | Totale (somma) |
ApiName , OperationName , Region , StreamType ModelDeploymentName , ModelName , , ModelVersion StatusCode |
PT1M | Sì |
Categoria: Azure OpenAI - Latenza
Metrica | Nome nell'API REST | Unità | Aggregazione | Dimensioni | Intervalli di tempo | Esportazione DS |
---|---|---|---|---|---|---|
Tempo tra token Per le richieste di streaming; frequenza di generazione dei token del modello, misurata in millisecondi. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo. |
AzureOpenAINormalizedTBTInMS |
Millisecondi | Massimo, Minimo, Medio |
Region , ModelDeploymentName , ModelName ModelVersion |
PT1M | Sì |
Tempo normalizzato al primo byte Per le richieste in streaming e non in streaming; il tempo necessario per ricevere il primo byte di dati di risposta dopo che la richiesta è stata effettuata dal modello, normalizzato tramite token. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo. |
AzureOpenAINormalizedTTFTInMS |
Millisecondi | Massimo, Minimo, Medio |
Region , ModelDeploymentName , ModelName ModelVersion |
PT1M | Sì |
Tempo di risposta Misura di latenza consigliata (velocità di risposta) per le richieste di streaming. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo. Calcolato come tempo impiegato per la comparsa della prima risposta dopo l’invio da parte dell’utente di una richiesta, come misurato dal gateway API. Questo numero aumenta quando le dimensioni delle richieste aumentano e/o si riducono le dimensioni della cache. Per suddividere il tempo per la metrica di risposta, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName e ModelVersion. Nota: questa metrica è un'approssimazione in quanto latenza misurata dipende in larga misura da più fattori, tra cui chiamate simultanee e modello di carico di lavoro complessivo. Inoltre, non tiene conto di alcuna latenza lato client che può esistere tra il client e l'endpoint API. Per un rilevamento ottimale della latenza, fare riferimento alla registrazione personalizzata. |
AzureOpenAITimeToResponse |
Millisecondi | Minimo, Massimo, Medio |
ApiName , OperationName , Region , StreamType ModelDeploymentName , ModelName , , ModelVersion StatusCode |
PT1M | Sì |
Token al secondo Enumera la velocità di generazione per una risposta del modello OpenAI di Azure specificata. I token totali generati vengono divisi per il tempo necessario per generare i token, in secondi. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo. |
AzureOpenAITokenPerSecond |
Conteggio | Massimo, Minimo, Medio |
Region , ModelDeploymentName , ModelName ModelVersion |
PT1M | Sì |
Time to Last Byte Per le richieste in streaming e non in streaming; il tempo necessario per ricevere l'ultimo byte di dati di risposta dopo che la richiesta è stata effettuata dal modello. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo. |
AzureOpenAITTLTInMS |
Millisecondi | Massimo, Minimo, Medio |
Region , ModelDeploymentName , ModelName ModelVersion |
PT1M | Sì |
Categoria: Azure OpenAI - Utilizzo
Metrica | Nome nell'API REST | Unità | Aggregazione | Dimensioni | Intervalli di tempo | Esportazione DS |
---|---|---|---|---|---|---|
Token attivi Token totali meno token memorizzati nella cache in un intervallo di tempo. Si applica alle distribuzioni PTU e gestite da PTU. Usare questa metrica per comprendere l'utilizzo basato su TPS o TPM per le PTU e confrontare i benchmark per i TPM o TPS di destinazione degli scenari in uso. Per suddividere le richieste API, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName e ModelVersion. |
ActiveTokens |
Conteggio | Minimo, Massimo, Media, Totale (Somma) |
Region , ModelDeploymentName , ModelName ModelVersion |
PT1M | Sì |
Token di completamento audio Numero di token di richiesta audio generati (output) in un modello OpenAI. Si applica alle implementazioni del modello gestite tramite PTU e al modello a pagamento in base al consumo. |
AudioCompletionTokens |
Conteggio | Totale (somma) |
ModelDeploymentName , ModelName , ModelVersion Region |
PT1M | Sì |
Token di richiesta audio Numero di token di richiesta audio elaborati (input) in un modello OpenAI. Si applica alle implementazioni del modello gestite tramite PTU e al modello a pagamento in base al consumo. |
AudioPromptTokens |
Conteggio | Totale (somma) |
ModelDeploymentName , ModelName , ModelVersion Region |
PT1M | Sì |
Tasso di corrispondenza nella cache dei token di richiesta Percentuale di token di richiesta con riscontro nella cache. Si applica alle distribuzioni PTU e gestite da PTU. |
AzureOpenAIContextTokensCacheMatchRate |
Percentuale | Minimo, Massimo, Medio |
Region , ModelDeploymentName , ModelName ModelVersion |
PT1M | NO |
Utilizzo gestito con provisioning (deprecato) % di utilizzo per una distribuzione gestita con provisioning, calcolata come (PTU utilizzate/PTU distribuite) x 100. Quando l'utilizzo è maggiore o uguale al 100%, le chiamate vengono limitate e viene restituito il codice di errore 429. Per suddividere questa metrica, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName, ModelVersion e StreamType (streaming e richieste non di streaming) |
AzureOpenAIProvisionedManagedUtilization |
Percentuale | Minimo, Massimo, Medio |
Region , StreamType , ModelDeploymentName , ModelName ModelVersion |
PT1M | NO |
Utilizzo gestito con provisioning V2 % di utilizzo per una distribuzione gestita con provisioning, calcolata come (PTU utilizzate/PTU distribuite) x 100. Quando l'utilizzo è maggiore o uguale al 100%, le chiamate vengono limitate e viene restituito il codice di errore 429. Per suddividere questa metrica, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName, ModelVersion e StreamType (streaming e richieste non di streaming) |
AzureOpenAIProvisionedManagedUtilizationV2 |
Percentuale | Minimo, Massimo, Medio |
Region , StreamType , ModelDeploymentName , ModelName ModelVersion |
PT1M | NO |
Ore di training ottimizzato elaborate Numero di ore di training elaborate in un modello ottimizzato di OpenAI |
FineTunedTrainingHours |
Conteggio | Totale (somma) |
ApiName , ModelDeploymentName , FeatureName , UsageChannel Region |
PT1M | Sì |
Token di completamento generati Numero di token generati (output) da un modello OpenAI. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo. Per suddividere questa metrica, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName e ModelName. |
GeneratedTokens |
Conteggio | Totale (somma) |
ApiName , ModelDeploymentName , FeatureName , UsageChannel , Region ModelVersion |
PT1M | Sì |
Token di richiesta elaborati Numero di token di richiesta elaborati (input) in un modello OpenAI. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo. Per suddividere questa metrica, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName e ModelName. |
ProcessedPromptTokens |
Conteggio | Totale (somma) |
ApiName , ModelDeploymentName , FeatureName , UsageChannel , Region ModelVersion |
PT1M | Sì |
Token di inferenza elaborati Numero di token di inferenza elaborati in un modello OpenAI. Calcolato sommando i token di richiesta (input) e i token generati (output). Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo. Per suddividere questa metrica, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName e ModelName. |
TokenTransaction |
Conteggio | Totale (somma) |
ApiName , ModelDeploymentName , FeatureName , UsageChannel , Region ModelVersion |
PT1M | Sì |
Categoria: Servizi cognitivi - Richieste HTTP
Metrica | Nome nell'API REST | Unità | Aggregazione | Dimensioni | Intervalli di tempo | Esportazione DS |
---|---|---|---|---|---|---|
Chiamate bloccate Numero di chiamate che hanno superato il limite di frequenza o di quota. Non usare per il Servizio OpenAI di Azure. |
BlockedCalls |
Conteggio | Totale (somma) |
ApiName , OperationName , Region RatelimitKey |
PT1M | Sì |
Errori del client Numero di chiamate con errore sul lato client (codice di risposta HTTP 4xx). Non usare per il Servizio OpenAI di Azure. |
ClientErrors |
Conteggio | Totale (somma) |
ApiName , OperationName , Region RatelimitKey |
PT1M | Sì |
Dati in entrata Dimensione in byte dei dati in entrata. Non usare per il Servizio OpenAI di Azure. |
DataIn |
Byte | Totale (somma) |
ApiName , OperationName , Region |
PT1M | Sì |
Dati in uscita Dimensione in byte dei dati in uscita. Non usare per il Servizio OpenAI di Azure. |
DataOut |
Byte | Totale (somma) |
ApiName , OperationName , Region |
PT1M | Sì |
Latenza Latenza in millisecondi. Non usare per il Servizio OpenAI di Azure. |
Latency |
Millisecondi | Media |
ApiName , OperationName , Region RatelimitKey |
PT1M | Sì |
Ratelimit Ratelimit corrente della chiave ratelimit. Non usare per il Servizio OpenAI di Azure. |
Ratelimit |
Conteggio | Totale (somma) |
Region , RatelimitKey |
PT1M | Sì |
Errori del server Numero di chiamate con errore interno del servizio (codice di risposta HTTP 5xx). Non usare per il Servizio OpenAI di Azure. |
ServerErrors |
Conteggio | Totale (somma) |
ApiName , OperationName , Region RatelimitKey |
PT1M | Sì |
Chiamate riuscite Numero di chiamate riuscite. Non usare per il Servizio OpenAI di Azure. |
SuccessfulCalls |
Conteggio | Totale (somma) |
ApiName , OperationName , Region RatelimitKey |
PT1M | Sì |
Totale chiamate Numero totale di chiamate. Non usare per il Servizio OpenAI di Azure. |
TotalCalls |
Conteggio | Totale (somma) |
ApiName , OperationName , Region RatelimitKey |
PT1M | Sì |
Totale errori Numero totale di chiamate con risposta di errore (codice di risposta HTTP 4xx o 5xx). Non usare per il Servizio OpenAI di Azure. |
TotalErrors |
Conteggio | Totale (somma) |
ApiName , OperationName , Region RatelimitKey |
PT1M | Sì |
Totale chiamate token Numero totale di chiamate token. |
TotalTokenCalls |
Conteggio | Totale (somma) |
ApiName , OperationName , Region |
PT1M | Sì |
Categoria: Servizi cognitivi - SLI
Metrica | Nome nell'API REST | Unità | Aggregazione | Dimensioni | Intervalli di tempo | Esportazione DS |
---|---|---|---|---|---|---|
AvailabilityRate Percentuale di disponibilità con il calcolo seguente: (Totale chiamate - Errori del server)/Chiamate totali. Gli errori del server includono tutte le risposte HTTP >=500. Non usare per il Servizio OpenAI di Azure. |
SuccessRate |
Percentuale | Minimo, Massimo, Medio |
ApiName , OperationName , Region RatelimitKey |
PT1M | NO |
Categoria: ContentSafety - Rischi&Sicurezza
Metrica | Nome nell'API REST | Unità | Aggregazione | Dimensioni | Intervalli di tempo | Esportazione DS |
---|---|---|---|---|---|---|
Conteggio utenti potenzialmente offensivi Numero di utenti potenzialmente offensivi che hanno rilevato nel corso di un periodo di tempo. È possibile aggiungere un filtro o applicare la suddivisione in base alla dimensione seguente: ModelDeploymentName. |
RAIAbusiveUsersCount |
Conteggio | Totale (somma) |
Region , ModelDeploymentName |
PT1M | Sì |
Volume dannoso rilevato Numero di chiamate effettuate all'API OpenAI di Azure e rilevate come dannose (sia il modello di blocco che la modalità di annotazione) da parte del filtro contenuto applicato per un periodo di tempo. È possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName e TextType. |
RAIHarmfulRequests |
Conteggio | Totale (somma) |
Region , ModelDeploymentName , ModelName , ModelVersion ApiName , TextType , , Category Severity |
PT1M | Sì |
Volume bloccato Numero di chiamate effettuate all'API OpenAI di Azure e rifiutate dal filtro contenuto applicato per un periodo di tempo. È possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName e TextType. |
RAIRejectedRequests |
Conteggio | Totale (somma) |
Region , ModelDeploymentName , ModelName , ModelVersion ApiName , , TextType Category |
PT1M | Sì |
Evento del sistema di sicurezza Evento di sistema per i rischi e il monitoraggio della sicurezza. È possibile aggiungere un filtro o applicare la suddivisione in base alla dimensione seguente: EventType. |
RAISystemEvent |
Conteggio | Media |
Region , EventType |
PT1M | Sì |
Volume totale inviato per il controllo della sicurezza Numero di chiamate effettuate all'API OpenAI di Azure e rilevate dal filtro del contenuto applicato per un periodo di tempo. È possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName. |
RAITotalRequests |
Conteggio | Totale (somma) |
Region , ModelDeploymentName , ModelName , ModelVersion ApiName |
PT1M | Sì |
Categoria: Sicurezza dei Contenuti - Utilizzo
Metrica | Nome nell'API REST | Unità | Aggregazione | Dimensioni | Intervalli di tempo | Esportazione DS |
---|---|---|---|---|---|---|
Conteggio chiamate per moderazione immagini Numero di chiamate per la moderazione delle immagini. |
ContentSafetyImageAnalyzeRequestCount |
Conteggio | Totale (somma) | ApiVersion |
PT1M | Sì |
Conteggio chiamate per moderazione testo Numero di chiamate per la moderazione del testo. |
ContentSafetyTextAnalyzeRequestCount |
Conteggio | Totale (somma) | ApiVersion |
PT1M | Sì |
Categoria: stime
Metrica | Nome nell'API REST | Unità | Aggregazione | Dimensioni | Intervalli di tempo | Esportazione DS |
---|---|---|---|---|---|---|
Conteggio eventi casuali di base Stima per il numero di eventi casuali di base. |
BaselineRandomEventCount |
Conteggio | Totale (somma) |
Mode , RunId |
PT1M | Sì |
Ricompensa casuale di base Stima della ricompensa casuale di base. |
BaselineRandomReward |
Conteggio | Totale (somma) |
Mode , RunId |
PT1M | Sì |
Conteggio eventi online Stima del numero di eventi online. |
OnlineEventCount |
Conteggio | Totale (somma) |
Mode , RunId |
PT1M | Sì |
Premio online Stima della ricompensa online. |
OnlineReward |
Conteggio | Totale (somma) |
Mode , RunId |
PT1M | Sì |
Conteggio eventi di base utente Stima per il conteggio degli eventi di base definiti dall'utente. |
UserBaselineEventCount |
Conteggio | Totale (somma) |
Mode , RunId |
PT1M | Sì |
Ricompensa base dell'utente Stima per la ricompensa di base definita dall'utente. |
UserBaselineReward |
Conteggio | Totale (somma) |
Mode , RunId |
PT1M | Sì |
Categoria: occorrenze delle funzionalità
Metrica | Nome nell'API REST | Unità | Aggregazione | Dimensioni | Intervalli di tempo | Esportazione DS |
---|---|---|---|---|---|---|
Occorrenze delle funzionalità di azione Numero di volte in cui viene visualizzata ogni funzionalità di azione. |
ActionFeatureIdOccurrences |
Conteggio | Totale (somma) |
FeatureId , Mode , RunId |
PT1M | Sì |
Occorrenze delle funzionalità di contesto Numero di volte in cui viene visualizzata ogni funzionalità di contesto. |
ContextFeatureIdOccurrences |
Conteggio | Totale (somma) |
FeatureId , Mode , RunId |
PT1M | Sì |
Occorrenze delle funzionalità di slot Numero di volte in cui viene visualizzata ogni funzionalità dello slot. |
SlotFeatureIdOccurrences |
Conteggio | Totale (somma) |
FeatureId , Mode , RunId |
PT1M | Sì |
Categoria: cardinalità delle funzionalità
Metrica | Nome nell'API REST | Unità | Aggregazione | Dimensioni | Intervalli di tempo | Esportazione DS |
---|---|---|---|---|---|---|
Cardinalità delle funzionalità in base all'azione Cardinalità delle funzionalità in base all'azione. |
FeatureCardinality_Action |
Conteggio | Media |
FeatureId , Mode , RunId |
PT1M | Sì |
Cardinalità delle funzionalità in base al contesto Cardinalità delle funzionalità in base al contesto. |
FeatureCardinality_Context |
Conteggio | Media |
FeatureId , Mode , RunId |
PT1M | Sì |
Cardinalità delle funzionalità in base allo slot Cardinalità delle funzionalità in base allo slot. |
FeatureCardinality_Slot |
Conteggio | Media |
FeatureId , Mode , RunId |
PT1M | Sì |
Categoria: funzionalità per evento
Metrica | Nome nell'API REST | Unità | Aggregazione | Dimensioni | Intervalli di tempo | Esportazione DS |
---|---|---|---|---|---|---|
Funzionalità di azione per evento Numero medio di funzionalità di azione per evento. |
ActionFeaturesPerEvent |
Conteggio | Media |
Mode , RunId |
PT1M | Sì |
Caratteristiche del contesto per evento Numero di funzionalità di contesto per evento. |
ContextFeaturesPerEvent |
Conteggio | Media |
Mode , RunId |
PT1M | Sì |
Funzionalità di slot per evento Numero medio di funzionalità di slot per evento. |
SlotFeaturesPerEvent |
Conteggio | Media |
Mode , RunId |
PT1M | Sì |
Categoria: Lingua - Lavori
Metrica | Nome nell'API REST | Unità | Aggregazione | Dimensioni | Intervalli di tempo | Esportazione DS |
---|---|---|---|---|---|---|
Durata processo (anteprima) Nota: questo valore dipende principalmente dalle dimensioni di input, dal numero di documenti e dalla complessità dell'attività. Si tratta di un valore aggregato in tutte le attività del processo. |
JobDuration |
Millisecondi | Minimo, Massimo, Medio |
JobStatus , JobType |
PT1M | Sì |
Categoria: Modelli - Richieste HTTP
Metrica | Nome nell'API REST | Unità | Aggregazione | Dimensioni | Intervalli di tempo | Esportazione DS |
---|---|---|---|---|---|---|
Frequenza di disponibilità del modello Percentuale di disponibilità con il calcolo seguente: (Totale chiamate - Errori del server)/Chiamate totali. Gli errori del server includono tutte le risposte HTTP >=500. |
ModelAvailabilityRate |
Percentuale | Minimo, Massimo, Medio |
Region , ModelDeploymentName , ModelName ModelVersion |
PT1M | NO |
Richieste di modello Numero di chiamate effettuate all'API del modello in un periodo di tempo. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo. |
ModelRequests |
Conteggio | Totale (somma) |
ApiName , OperationName , Region , StreamType ModelDeploymentName , ModelName , , ModelVersion StatusCode |
PT1M | Sì |
Categoria: Modelli - Latenza
Metrica | Nome nell'API REST | Unità | Aggregazione | Dimensioni | Intervalli di tempo | Esportazione DS |
---|---|---|---|---|---|---|
Intervallo di Tempo tra i Token Per le richieste di streaming; Frequenza di generazione dei token del modello, misurata in millisecondi. Si applica alle distribuzioni PTU e gestite da PTU. |
NormalizedTimeBetweenTokens |
Millisecondi | Massimo, Minimo, Medio |
ApiName , OperationName , Region , StreamType ModelDeploymentName , , ModelName ModelVersion |
PT1M | Sì |
Tempo normalizzato al primo byte Per le richieste in streaming e non in streaming; il tempo necessario per ricevere il primo byte di dati di risposta dopo che la richiesta è stata effettuata dal modello, normalizzato tramite token. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo. |
NormalizedTimeToFirstToken |
Millisecondi | Massimo, Minimo, Medio |
ApiName , OperationName , Region , StreamType ModelDeploymentName , , ModelName ModelVersion |
PT1M | Sì |
Time to Last Byte Per le richieste in streaming e non in streaming; il tempo necessario per ricevere l'ultimo byte di dati di risposta dopo che la richiesta è stata effettuata dal modello. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo. |
TimeToLastByte |
Millisecondi | Massimo, Minimo, Medio |
ApiName , OperationName , Region , StreamType ModelDeploymentName , , ModelName ModelVersion |
PT1M | Sì |
Tempo di risposta Misura di latenza consigliata (velocità di risposta) per le richieste di streaming. Si applica alle distribuzioni PTU e gestite da PTU. Calcolato come tempo impiegato per la comparsa della prima risposta dopo l’invio da parte dell’utente di una richiesta, come misurato dal gateway API. Questo numero aumenta quando le dimensioni delle richieste aumentano e/o si riducono le dimensioni della cache. Per suddividere il tempo per la metrica di risposta, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName e ModelVersion. Nota: questa metrica è un'approssimazione in quanto latenza misurata dipende in larga misura da più fattori, tra cui chiamate simultanee e modello di carico di lavoro complessivo. Inoltre, non tiene conto di alcuna latenza lato client che può esistere tra il client e l'endpoint API. Per un rilevamento ottimale della latenza, fare riferimento alla registrazione personalizzata. |
TimeToResponse |
Millisecondi | Minimo, Massimo, Medio |
ApiName , OperationName , Region , StreamType ModelDeploymentName , ModelName , , ModelVersion StatusCode |
PT1M | Sì |
Token al secondo Enumera la velocità di generazione per una determinata risposta del modello. I token totali generati vengono divisi per il tempo necessario per generare i token, in secondi. Si applica alle distribuzioni PTU e gestite da PTU. |
TokensPerSecond |
Conteggio | Massimo, Minimo, Medio |
ApiName , OperationName , Region , StreamType ModelDeploymentName , , ModelName ModelVersion |
PT1M | Sì |
Categoria: Modelli - Utilizzo
Metrica | Nome nell'API REST | Unità | Aggregazione | Dimensioni | Intervalli di tempo | Esportazione DS |
---|---|---|---|---|---|---|
Token di input Numero di token di richiesta elaborati (input) su un modello. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo. |
InputTokens |
Conteggio | Totale (somma) |
ApiName , Region , ModelDeploymentName , ModelName ModelVersion |
PT1M | Sì |
Token di uscita Numero di token generati (output) da un modello OpenAI. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo. |
OutputTokens |
Conteggio | Totale (somma) |
ApiName , Region , ModelDeploymentName , ModelName ModelVersion |
PT1M | Sì |
Utilizzo assegnato % di utilizzo per una distribuzione gestita con provisioning, calcolata come (PTU utilizzate/PTU distribuite) x 100. Quando l'utilizzo è maggiore o uguale al 100%, le chiamate vengono limitate e viene restituito il codice di errore 429. |
ProvisionedUtilization |
Percentuale | Minimo, Massimo, Medio |
Region , ModelDeploymentName , ModelName ModelVersion |
PT1M | NO |
Totale token Numero di token di inferenza elaborati in un modello. Calcolato sommando i token di richiesta (input) e i token generati (output). Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo. |
TotalTokens |
Conteggio | Totale (somma) |
ApiName , Region , ModelDeploymentName , ModelName ModelVersion |
PT1M | Sì |
Categoria: spazi dei nomi per evento
Metrica | Nome nell'API REST | Unità | Aggregazione | Dimensioni | Intervalli di tempo | Esportazione DS |
---|---|---|---|---|---|---|
Spazi dei nomi delle azioni per evento Numero medio di namespace di azioni per evento. |
ActionNamespacesPerEvent |
Conteggio | Media |
Mode , RunId |
PT1M | Sì |
Spazi dei nomi di contesto per evento Numero di spazi dei nomi di contesto per evento. |
ContextNamespacesPerEvent |
Conteggio | Media |
Mode , RunId |
PT1M | Sì |
Spazi dei nomi degli slot per evento Numero medio di spazi dei nomi degli slot per evento. |
SlotNamespacesPerEvent |
Conteggio | Media |
Mode , RunId |
PT1M | Sì |
Categoria: Premi
Metrica | Nome nell'API REST | Unità | Aggregazione | Dimensioni | Intervalli di tempo | Esportazione DS |
---|---|---|---|---|---|---|
Ricompensa media per evento Ricompensa media per evento. |
Reward |
Conteggio | Media |
BaselineAction , ChosenActionId , MatchesBaseline , NonDefaultReward , Mode RunId |
PT1M | Sì |
Premio slot Ricompensa per posizione. |
SlotReward |
Conteggio | Media |
BaselineActionId , ChosenActionId , MatchesBaseline , NonDefaultReward SlotId , SlotIndex , , Mode RunId |
PT1M | Sì |
Categoria: slot
Metrica | Nome nell'API REST | Unità | Aggregazione | Dimensioni | Intervalli di tempo | Esportazione DS |
---|---|---|---|---|---|---|
Ricompensa complessiva dello stimatore della linea di base Ricompensa complessiva dell'estimatore di base. |
BaselineEstimatorOverallReward |
Conteggio | Media |
Mode , RunId |
PT1M | Sì |
Premio slot dello strumento di stima di base Premio dello strumento di stima di base per slot. |
BaselineEstimatorSlotReward |
Conteggio | Media |
SlotId , SlotIndex , Mode RunId |
PT1M | Sì |
Stimatore casuale di base Ricompensa complessiva Ricompensa complessiva dello stimatore casuale di base. |
BaselineRandomEstimatorOverallReward |
Conteggio | Media |
Mode , RunId |
PT1M | Sì |
Premio slot dello strumento di stima casuale di base Premio dello strumento di stima casuale di base per slot. |
BaselineRandomEstimatorSlotReward |
Conteggio | Media |
SlotId , SlotIndex , Mode RunId |
PT1M | Sì |
Slot Numero di slot per evento. |
NumberOfSlots |
Conteggio | Media |
Mode , RunId |
PT1M | Sì |
Ricompensa complessiva del valutatore online Premio complessivo dello strumento di stima online. |
OnlineEstimatorOverallReward |
Conteggio | Media |
Mode , RunId |
PT1M | Sì |
Premio slot dello strumento di stima online Premio dello strumento di stima online per slot. |
OnlineEstimatorSlotReward |
Conteggio | Media |
SlotId , SlotIndex , Mode RunId |
PT1M | Sì |
Occorrenze di slot Numero di volte in cui viene visualizzato ogni slot. |
SlotIdOccurrences |
Conteggio | Totale (somma) |
SlotId , SlotIndex , Mode RunId |
PT1M | Sì |
Categoria: SpeechServices - Utilizzo
Metrica | Nome nell'API REST | Unità | Aggregazione | Dimensioni | Intervalli di tempo | Esportazione DS |
---|---|---|---|---|---|---|
Secondi audio trascritti Numero di secondi trascritti |
AudioSecondsTranscribed |
Conteggio | Totale (somma) |
ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Secondi audio tradotti Numero di secondi tradotti |
AudioSecondsTranslated |
Conteggio | Totale (somma) |
ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Secondi di hosting del modello avatar Numero di secondi. |
AvatarModelHostingSeconds |
Conteggio | Totale (somma) |
ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Secondi di addestramento del modello Avatar Numero di secondi. |
AvatarModelTrainingSeconds |
Conteggio | Totale (somma) |
ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Numero di profili degli speaker Numero di profili voce registrati. Ripartizione oraria. |
NumberofSpeakerProfiles |
Conteggio | Totale (somma) |
ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Transazioni di riconoscimento del parlante Numero di transazioni di riconoscimento voce |
SpeakerRecognitionTransactions |
Conteggio | Totale (somma) |
ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Ore di hosting del modello di riconoscimento vocale Numero di ore di hosting del modello di riconoscimento vocale |
SpeechModelHostingHours |
Conteggio | Totale (somma) |
ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Caratteri sintetizzati Numero di caratteri. |
SynthesizedCharacters |
Conteggio | Totale (somma) |
ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Secondi video sintetizzati Numero di secondi sintetizzati |
VideoSecondsSynthesized |
Conteggio | Totale (somma) |
ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Ore di hosting del modello vocale Numero di ore. |
VoiceModelHostingHours |
Conteggio | Totale (somma) |
ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Minuti di addestramento del modello vocale Numero di minuti. |
VoiceModelTrainingMinutes |
Conteggio | Totale (somma) |
ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Categoria: Uso
Metrica | Nome nell'API REST | Unità | Aggregazione | Dimensioni | Intervalli di tempo | Esportazione DS |
---|---|---|---|---|---|---|
Conteggio inferenze Conteggio delle inferenze del servizio Carnegie Frontdoor |
CarnegieInferenceCount |
Conteggio | Totale (somma) |
Region , Modality , Category , Language , SeverityLevel UseCustomList |
PT1M | Sì |
Caratteri sottoposti a training (deprecato) Numero totale di caratteri sottoposti a training. |
CharactersTrained |
Conteggio | Totale (somma) |
ApiName , OperationName , Region |
PT1M | Sì |
Caratteri tradotti (obsoleto) Numero totale di caratteri nella richiesta di testo in ingresso. |
CharactersTranslated |
Conteggio | Totale (somma) |
ApiName , OperationName , Region |
PT1M | Sì |
Transazioni di Visione Artificiale Numero delle transazioni di visione artificiale |
ComputerVisionTransactions |
Conteggio | Totale (somma) |
ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Tempo di training di Visione personalizzata Tempo di addestramento di Custom Vision |
CustomVisionTrainingTime |
Secondi | Totale (somma) |
ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Transazioni di Visione personalizzata Numero di transazioni di previsione di Visione personalizzata |
CustomVisionTransactions |
Conteggio | Totale (somma) |
ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Caratteri documento tradotti Numero di caratteri nella richiesta di traduzione dei documenti. |
DocumentCharactersTranslated |
Conteggio | Totale (somma) |
ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Caratteri personalizzati del documento tradotti Numero di caratteri nella richiesta di traduzione documenti personalizzata. |
DocumentCustomCharactersTranslated |
Conteggio | Totale (somma) |
ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Immagini del viso sottoposte a training Numero di immagini sottoposte a training. 1.000 immagini sottoposte a training per transazione. |
FaceImagesTrained |
Conteggio | Totale (somma) |
ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Visi archiviati Numero di volti archiviati, proporzionato giornalmente. Il numero di visi archiviati viene segnalato ogni giorno. |
FacesStored |
Conteggio | Totale (somma) |
ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Transazioni viso Numero di chiamate API effettuate al servizio Face |
FaceTransactions |
Conteggio | Totale (somma) |
ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Immagini archiviate Numero di immagini Visione personalizzata archiviate. |
ImagesStored |
Conteggio | Totale (somma) |
ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Eventi analizzati Numero di eventi analizzati. |
LearnedEvents |
Conteggio | Totale (somma) |
IsMatchBaseline , Mode , RunId |
PT1M | Sì |
Richieste di riconoscimento vocale LUIS Numero di richieste di riconoscimento finalità voce LUIS |
LUISSpeechRequests |
Conteggio | Totale (somma) |
ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Richieste di testo LUIS Numero di richieste di testo LUIS |
LUISTextRequests |
Conteggio | Totale (somma) |
ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Premi corrispondenti Numero di ricompense abbinate. |
MatchedRewards |
Conteggio | Totale (somma) |
Mode , RunId |
PT1M | Sì |
Eventi non attivati Numero di eventi saltati. |
NonActivatedEvents |
Conteggio | Totale (somma) |
Mode , RunId |
PT1M | Sì |
Ricompense osservate Numero di ricompense osservate. |
ObservedRewards |
Conteggio | Totale (somma) |
Mode , RunId |
PT1M | Sì |
Caratteri di sincronizzazione documenti tradotti Numero di caratteri nella richiesta di traduzione dei documenti (sincrona). |
OneDocumentCharactersTranslated |
Conteggio | Totale (somma) |
ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Caratteri personalizzati di sincronizzazione documenti tradotti Numero di caratteri nella richiesta di traduzione documento personalizzata (sincrona). |
OneDocumentCustomCharactersTranslated |
Conteggio | Totale (somma) |
ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Caratteri elaborati Numero di caratteri elaborati da Strumento di lettura immersiva. |
ProcessedCharacters |
Conteggio | Totale (somma) |
ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Record di testo per la salute elaborati Numero di record di testo per la salute elaborati |
ProcessedHealthTextRecords |
Conteggio | Totale (somma) |
ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Immagini elaborate Numero di immagini elaborate |
ProcessedImages |
Conteggio | Totale (somma) |
ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Pagine elaborate Numero di pagine elaborate |
ProcessedPages |
Conteggio | Totale (somma) |
ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Record di testo elaborati Conteggio dei record di testo. |
ProcessedTextRecords |
Conteggio | Totale (somma) |
ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Record di testo QA Numero di record di testo elaborati |
QuestionAnsweringTextRecords |
Conteggio | Totale (somma) |
ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Durata della sessione vocale (obsoleta) Durata totale della sessione vocale in secondi. |
SpeechSessionDuration |
Secondi | Totale (somma) |
ApiName , OperationName , Region |
PT1M | Sì |
Caratteri di testo tradotti Numero di caratteri nella richiesta di traduzione testuale in ingresso. |
TextCharactersTranslated |
Conteggio | Totale (somma) |
ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Caratteri personalizzati di testo tradotti Numero di caratteri nella richiesta di traduzione di testo personalizzata in ingresso. |
TextCustomCharactersTranslated |
Conteggio | Totale (somma) |
ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Caratteri sottoposti a training del testo Numero di caratteri sottoposti a training usando la traduzione testuale. |
TextTrainedCharacters |
Conteggio | Totale (somma) |
ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Totale eventi Numero di eventi. |
TotalEvents |
Conteggio | Totale (somma) |
Mode , RunId |
PT1M | Sì |
Totale transazioni (deprecato) Numero totale di transazioni. |
TotalTransactions |
Conteggio | Totale (somma) | <nessuno> | PT1M | Sì |
Secondi nell'app Translator Pro Numero di secondi di utilizzo di Translator Pro App. |
TranslatorProAppSeconds |
Secondi | Totale (somma) |
ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |