summary.mlModel: riepilogo di un modello di Microsoft R Machine Learning.

Riepilogo di un modello di Microsoft R Machine Learning.

Uso

 ## S3 method for class `mlModel':
summary  (object, top = 20, ...)

Argomenti

`object`

Oggetto modello restituito da un'analisi MicrosoftML .

`top`

Specifica il numero di coefficienti principali da visualizzare nel riepilogo per i modelli lineari, ad esempio rxLogisticRegression e rxFastLinear. La distorsione viene visualizzata per prima, seguita da altri pesi, ordinati in base ai valori assoluti in ordine decrescente. Se impostato su NULL, vengono visualizzati tutti i coefficienti diversi da zero. In caso contrario, vengono visualizzati solo i primi top coefficienti.

`...`

Argomenti aggiuntivi da passare al metodo di riepilogo.

Dettagli

Fornisce informazioni di riepilogo sulla chiamata di funzione originale,
set di dati usato per eseguire il training del modello e statistiche per i coefficienti nel modello.

Valore

Il summary metodo degli oggetti di analisi MicrosoftML restituisce un elenco che include la chiamata di funzione originale e i parametri sottostanti utilizzati. Il coef metodo restituisce un vettore denominato di pesi, elaborando le informazioni dall'oggetto modello.

Per rxLogisticRegression, le statistiche seguenti possono essere presenti anche nel riepilogo quando showTrainingStats è impostato su TRUE.

`training.size`

Dimensioni, in termini di conteggio delle righe, del set di dati usato per eseguire il training del modello.

`deviance`

La devianza del modello viene data da -2 * ln(L) dove L è la probabilità di ottenere le osservazioni con tutte le caratteristiche incorporate nel modello.

`null.deviance`

La devianza null è data da -2 * ln(L0) dove L0 è la probabilità di ottenere le osservazioni senza alcun effetto dalle caratteristiche. Il modello Null include la distorsione se ne esiste una nel modello.

`aic`

Il criterio di informazioni AIC (Akaike Information Criteria) è definito come 2 * k ``+ deviance, dove k è il numero di coefficienti del modello. La distorsione viene conteggiato come uno dei coefficienti. L'interfaccia AIC è una misura della qualità relativa del modello. Si occupa del compromesso tra la bontà di adattamento del modello (misurata dalla devianza) e la complessità del modello (misurata in base al numero di coefficienti).

`coefficients.stats`

Si tratta di un frame di dati contenente le statistiche per ogni coefficiente nel modello. Per ogni coefficiente vengono visualizzate le statistiche seguenti. La distorsione viene visualizzata nella prima riga e i coefficienti rimanenti nell'ordine crescente di p-value.

EstimateIl valore del coefficiente stimato del modello.
Std ErrorThis è la radice quadrata della varianza di campioni di grandi dimensioni della stima del coefficiente.
z-ScoreWe può verificare l'ipotesi nulla, che indica che il coefficiente deve essere zero, in relazione al significato del coefficiente calcolando il rapporto della stima e il relativo errore standard. In base all'ipotesi nulla, se non è applicata alcuna regolarizzazione, la stima del coefficiente relativo segue una distribuzione normale con media 0 e una deviazione standard uguale all'errore standard calcolato in precedenza. Il punteggio z restituisce il rapporto tra la stima di un coefficiente e l'errore standard del coefficiente.
Pr(>|z|) Si tratta del valore p corrispondente per il test a due lati del punteggio z. In base al livello di significatività, un indicatore di significato viene aggiunto al valore p. Se F(x) è il CDF della distribuzione N(0, 1)normale standard , P(>|z|) = 2 - ``2 * F(|z|)allora .

Autore/i

Microsoft Corporation Microsoft Technical Support

Vedere anche

rxFastTrees, rxFastForest, rxFastLinear, rxOneClassSvm, rxNeuralNet, rxLogisticRegression.

Esempi


 # Estimate a logistic regression model
 logitModel <- rxLogisticRegression(isCase ~ age + parity + education + spontaneous + induced,
                   transforms = list(isCase = case == 1),
                   data = infert)
 # Print a summary of the model
 summary(logitModel)

 # Score to a data frame
 scoreDF <- rxPredict(logitModel, data = infert, 
     extraVarsToWrite = "isCase")

 # Compute and plot the Radio Operator Curve and AUC
 roc1 <- rxRoc(actualVarName = "isCase", predVarNames = "Probability", data = scoreDF) 
 plot(roc1)
 rxAuc(roc1)

 #######################################################################################
 # Multi-class logistic regression  
 testObs <- rnorm(nrow(iris)) > 0
 testIris <- iris[testObs,]
 trainIris <- iris[!testObs,]
 multiLogit <- rxLogisticRegression(
     formula = Species~Sepal.Length + Sepal.Width + Petal.Length + Petal.Width,
     type = "multiClass", data = trainIris)

 # Score the model
 scoreMultiDF <- rxPredict(multiLogit, data = testIris, 
     extraVarsToWrite = "Species")    
 # Print the first rows of the data frame with scores
 head(scoreMultiDF)
 # Look at confusion matrix
 table(scoreMultiDF$Species, scoreMultiDF$PredictedLabel)

 # Look at the observations with incorrect predictions
 badPrediction = scoreMultiDF$Species != scoreMultiDF$PredictedLabel
 scoreMultiDF[badPrediction,]

Commenti e suggerimenti

Questa pagina è stata utile?

Last updated on 2025-06-05