Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Riepilogo di un modello di Microsoft R Machine Learning.
Uso
## S3 method for class `mlModel':
summary (object, top = 20, ...)
Argomenti
object
Oggetto modello restituito da un'analisi MicrosoftML .
top
Specifica il numero di coefficienti principali da visualizzare nel riepilogo per i modelli lineari, ad esempio rxLogisticRegression e rxFastLinear. La distorsione viene visualizzata per prima, seguita da altri pesi, ordinati in base ai valori assoluti in ordine decrescente. Se impostato su NULL, vengono visualizzati tutti i coefficienti diversi da zero. In caso contrario, vengono visualizzati solo i primi top coefficienti.
...
Argomenti aggiuntivi da passare al metodo di riepilogo.
Dettagli
Fornisce informazioni di riepilogo sulla chiamata di funzione originale,
set di dati usato per eseguire il training del modello e statistiche per i coefficienti nel modello.
Valore
Il summary metodo degli oggetti di analisi MicrosoftML restituisce un elenco che include la chiamata di funzione originale e i parametri sottostanti utilizzati. Il coef metodo restituisce un vettore denominato di pesi, elaborando le informazioni dall'oggetto modello.
Per rxLogisticRegression, le statistiche seguenti possono essere presenti anche nel riepilogo quando showTrainingStats è impostato su TRUE.
training.size
Dimensioni, in termini di conteggio delle righe, del set di dati usato per eseguire il training del modello.
deviance
La devianza del modello viene data da -2 * ln(L) dove L è la probabilità di ottenere le osservazioni con tutte le caratteristiche incorporate nel modello.
null.deviance
La devianza null è data da -2 * ln(L0) dove L0 è la probabilità di ottenere le osservazioni senza alcun effetto dalle caratteristiche. Il modello Null include la distorsione se ne esiste una nel modello.
aic
Il criterio di informazioni AIC (Akaike Information Criteria) è definito come 2 * k ``+ deviance, dove k è il numero di coefficienti del modello. La distorsione viene conteggiato come uno dei coefficienti. L'interfaccia AIC è una misura della qualità relativa del modello. Si occupa del compromesso tra la bontà di adattamento del modello (misurata dalla devianza) e la complessità del modello (misurata in base al numero di coefficienti).
coefficients.stats
Si tratta di un frame di dati contenente le statistiche per ogni coefficiente nel modello. Per ogni coefficiente vengono visualizzate le statistiche seguenti. La distorsione viene visualizzata nella prima riga e i coefficienti rimanenti nell'ordine crescente di p-value.
- EstimateIl valore del coefficiente stimato del modello.
- Std ErrorThis è la radice quadrata della varianza di campioni di grandi dimensioni della stima del coefficiente.
- z-ScoreWe può verificare l'ipotesi nulla, che indica che il coefficiente deve essere zero, in relazione al significato del coefficiente calcolando il rapporto della stima e il relativo errore standard. In base all'ipotesi nulla, se non è applicata alcuna regolarizzazione, la stima del coefficiente relativo segue una distribuzione normale con media 0 e una deviazione standard uguale all'errore standard calcolato in precedenza. Il punteggio z restituisce il rapporto tra la stima di un coefficiente e l'errore standard del coefficiente.
- Pr(>|z|) Si tratta del valore p corrispondente per il test a due lati del punteggio z. In base al livello di significatività, un indicatore di significato viene aggiunto al valore p. Se
F(x)è il CDF della distribuzioneN(0, 1)normale standard ,P(>|z|) = 2 - ``2 * F(|z|)allora .
Autore/i
Microsoft Corporation Microsoft Technical Support
Vedere anche
rxFastTrees, rxFastForest, rxFastLinear, rxOneClassSvm, rxNeuralNet, rxLogisticRegression.
Esempi
# Estimate a logistic regression model
logitModel <- rxLogisticRegression(isCase ~ age + parity + education + spontaneous + induced,
transforms = list(isCase = case == 1),
data = infert)
# Print a summary of the model
summary(logitModel)
# Score to a data frame
scoreDF <- rxPredict(logitModel, data = infert,
extraVarsToWrite = "isCase")
# Compute and plot the Radio Operator Curve and AUC
roc1 <- rxRoc(actualVarName = "isCase", predVarNames = "Probability", data = scoreDF)
plot(roc1)
rxAuc(roc1)
#######################################################################################
# Multi-class logistic regression
testObs <- rnorm(nrow(iris)) > 0
testIris <- iris[testObs,]
trainIris <- iris[!testObs,]
multiLogit <- rxLogisticRegression(
formula = Species~Sepal.Length + Sepal.Width + Petal.Length + Petal.Width,
type = "multiClass", data = trainIris)
# Score the model
scoreMultiDF <- rxPredict(multiLogit, data = testIris,
extraVarsToWrite = "Species")
# Print the first rows of the data frame with scores
head(scoreMultiDF)
# Look at confusion matrix
table(scoreMultiDF$Species, scoreMultiDF$PredictedLabel)
# Look at the observations with incorrect predictions
badPrediction = scoreMultiDF$Species != scoreMultiDF$PredictedLabel
scoreMultiDF[badPrediction,]