Dis que j'ai la matrice

> a <- matrix(c(1,2,3,4,5,6,7,8,9),nrow=3)
> rownames(a)=c('A','B','C')
> colnames(a)=c('A','B','C')
> a
  A B C
A 1 4 7
B 2 5 8
C 3 6 9

Étant donné que les colonnes représenteraient la classe réelle et les lignes la classe prédite, comment puis-je extraire les vecteurs de prédictions et de valeurs réelles pour les utiliser dans confusionMatrix() ?.

1
ForEverNewbie 14 oct. 2020 à 13:12

1 réponse

Meilleure réponse

Je suppose que vous faites référence à confusionMatrix() de caret. Il s'agit déjà d'une matrice de confusion, et vous pouvez simplement transmettre les prédictions à la fonction en utilisant as.table(), voir l'exemple, où nous configurons un modèle et entraînons/testons les données :

library(caret)
set.seed(111)
idx = sample(1:nrow(iris),100)
trainData = iris[idx,]
testData = iris[-idx,]

mdl = train(Species ~ .,data=trainData,
method="rf",trControl=trainControl(method="cv"))
pred = predict(mdl,testData)
actual = testData$Species

Matrice de confusion avec libellés :

confusionMatrix(pred,actual)
Confusion Matrix and Statistics

            Reference
Prediction   setosa versicolor virginica
  setosa         20          0         0
  versicolor      0         11         2
  virginica       0          0        17

Matrice de confusion avec table ou matrice :

a = matrix(table(pred,actual),nrow=3)
colnames(a) = levels(testData$Species)
rownames(a) = levels(testData$Species)

           setosa versicolor virginica
setosa         20          0         0
versicolor      0         11         2
virginica       0          0        17

confusionMatrix(as.table(a))

Confusion Matrix and Statistics

           setosa versicolor virginica
setosa         20          0         0
versicolor      0         11         2
virginica       0          0        17

Overall Statistics
                                          
               Accuracy : 0.96            
                 95% CI : (0.8629, 0.9951)
    No Information Rate : 0.4             
    P-Value [Acc > NIR] : < 2.2e-16  

Si vous en avez vraiment besoin dans un vecteur, (cela semble super bizarre pour moi) en utilisant un :

actual_vector = rep(colnames(a),colSums(a))
pred_vector = rep(rownames(a),rowSums(a))

table(actual_vector) == table(actual)
actual_vector
    setosa versicolor  virginica 
      TRUE       TRUE       TRUE 

table(pred_vector) == table(pred)
pred_vector
    setosa versicolor  virginica 
      TRUE       TRUE       TRUE 
2
StupidWolf 14 oct. 2020 à 15:38