Dans les algorithmes d'apprentissage et la classification statistique, une forêt aléatoire est un classificateur d'ensemble qui consiste en de nombreux arbres de décision. Il génère la classe qui est le mode des classes générées par les arbres individuels, en d'autres termes, la classe avec la fréquence la plus élevée.

random-forest...

Je suis un peu pressé de terminer cette présentation de demain au propriétaire du projet. Nous sommes un petit groupe d'étudiants en économie en Allemagne essayant de comprendre l'apprentissage automatique avec python. Nous avons mis en place un classificateur de forêt aléatoire et sommes désespérés....
J'ai un classificateur de forêt aléatoire stocké dans l'objet clf. En termes vraiment simplifiés , j'ai fait ce qui suit: # Import libraries import pandas as pd from import sklearn.ensemble import RandomForestClassifier as rfc # Import data exog = pd.read_csv('train.csv') trgt = pd.read_csv('targe....
18 mars 2020 à 00:20
J'essaie de former un RandomForestClassifier pour prédire si une critique est bonne (1) ou mauvaise (0) en fonction du nombre de mots. Mes données d'entraînement nommées all_train_set ressemblent à ceci: Reviews Labels 0 For fans of Chris Farley....
8 janv. 2020 à 06:52
En utilisant Python et sklearn, je veux tracer la courbe ROC pour les taux hors-sac (oob) vrais positifs et faux positifs d'un classificateur de forêt aléatoire. Je sais que cela est possible dans R, mais ne semble pas trouver d'informations sur la façon de le faire en Python.....
18 déc. 2019 à 22:56
Je dois effectuer une validation croisée avec absence de sortie du modèle RF. J'ai réussi à construire un modèle à haute capacité prédictive. Maintenant, je dois effectuer un test LOO avant la publication. Voici mon code: import pandas as pd import numpy as np import seaborn as sns %matplotlib inli....
Je dois effectuer une validation croisée avec absence de sortie du modèle RF. J'ai réussi à construire un modèle à haute capacité prédictive. Maintenant, je dois effectuer un test LOO pour la publication. Voici mon code: import pandas as pd import numpy as np import seaborn as sns %matplotlib inlin....
J'explore actuellement l'utilisation des forêts aléatoires pour prédire les valeurs futures des occurrences (mon modèle ARIMA m'a donné de très mauvaises prévisions, donc j'essaie d'évaluer d'autres options). Je suis pleinement conscient que les mauvais résultats peuvent être dus au fait que je n'ai....
11 déc. 2019 à 18:25
Je veux exécuter des expériences avec des réseaux de neurones à l'aide de PyTorch, j'ai donc essayé un simple exercice d'échauffement et je n'arrive pas à comprendre les résultats. L'exercice tente de prédire l'évaluation de 1000 problèmes TPTP à partir de diverses statistiques sur les problèmes tel....
J'essaye le code ci-dessous pour le classificateur de forêt aléatoire. Même si j'ai défini mais en obtenant NameError. Veuillez aider def RFC_model(randomState, X_train, X_test, y_train, y_test): rand_forest = RandomForestClassifier() rand_forest.fit(X_train, y_train) forest_test_predicti....
10 déc. 2019 à 16:57
J'ai donc formé un modèle RandomForest sur une donnée client assez simple. La prédiction est soit 1 soit 0 indiquant si un client se désintéressera ou non. Disons que j'ai 10 fonctionnalités appelées 'f1', 'f2', 'f3' et ainsi de suite ... Comme le modèle a déjà été formé, j'ai pris une autre période....
J'ai actuellement un jeu de données qui a été encodé et il ressemble à ceci: J'ai ensuite séparé les variables indépendantes et dépendantes en tant que telles, puis j'ai séparé l'ensemble de données en ensembles d'apprentissage et de test à l'aide de packages sklearn. X = df[['year', 'manufacturer'....
model = RandomForestClassifier(n_estimators=100) predictor_var = ['Gender', 'Married', 'Dependents', 'Education', 'Self_Employed', 'Loan_Amount_Term', 'Credit_History', 'Property_Area', 'LoanAmount_log','TotalIncome_log'] classification_model(model, df,predictor_var,outcome_var) ....
J'utilise le classificateur de forêt aléatoire pour classer les données en 4 étiquettes. Il y a un total de 20 fonctionnalités sur lesquelles le modèle est formé. J'observe une précision d'environ 45 à 47% lorsque l'ensemble de données de test est utilisé. Bien que sur la prédiction de l'ensemble de....
27 nov. 2019 à 17:17
Bonjour, j'utilise une forêt aléatoire pour construire un modèle et j'essaie de gérer les valeurs nulles. Quelqu'un pourrait-il savoir comment vous pourriez forcer le modèle de forêt aléatoire à traiter les valeurs nulles comme sa propre bande distincte? (comme dans les valeurs nulles ne sont jamais....
J'ai un échantillon de formation X_train, et Y_train pour m'entraîner et X_estimated. J'ai eu la tâche de faire en sorte que mon classificateur apprenne le plus précisément possible, puis de prédire le vecteur de résultats sur X_estimated pour obtenir des résultats proches de Y_estimated (que j'ai m....
Je reçois cette erreur lors de la recherche dans la grille pour ma classification avec forêt aléatoire . from sklearn.ensemble import RandomForestRegressor rf2 = RandomForestRegressor(random_state = 50) rf2.fit(X_train1, y_train1) ### Grid Search ### num_leafs = [1, 5, 10, 20, 50, 100] parame....
J'ai un Pandas DataFrame avec des colonnes de date. Les données sont importées à partir d'un fichier csv. Lorsque j'essaye d'adapter le modèle de régression, j'obtiens l'erreur ValueError: could not convert string to float: '2019-08-30 07:51:21. . Comment puis-je m'en débarrasser? Voici le dataframe....
21 sept. 2019 à 16:02
Veuillez me diriger dans la bonne direction avec celui-ci. Comment puis-je convertir une colonne qui contient une variable continue en une variable discrète? J'ai des prix d'instruments financiers que j'essaie de convertir en une sorte de valeur catégorique. Je pensais pouvoir faire ce qui suit. lab....
16 juil. 2019 à 00:29
J'utilise RandomForestClassifier comme suit en utilisant la validation croisée pour une classification binaire (les étiquettes de classe sont 0 et 1). from sklearn.ensemble import RandomForestClassifier from sklearn.model_selection import StratifiedKFold, cross_val_score clf=RandomForestClassifie....
Question: Existe-t-il un moyen d'extraire l'importance de la variable pour chaque modèle CART individuel à partir d'un objet randomForest? rf_mod$forest ne semble pas avoir cette information et la documentation ne le mentionnez pas. Dans le package randomForest de R, l'importance de la variable moy....
4 mai 2019 à 20:47
J'utilise le code suivant pour obtenir les paramètres optimisés pour randomforest en utilisant gridsearchcv. x_train, x_test, y_train, y_test = train_test_split(X, y, random_state=0) rfc = RandomForestClassifier(random_state=42, class_weight = 'balanced') param_grid = { 'n_estimators': [200, 50....
J'ai entraîné un modèle de forêt aléatoire et j'utilise une valeur random_state cohérente. J'obtiens également de très bonnes précisions sur mes ensembles de données d'entraînement, de test et de validation (tous sont autour de ~ .98). Bien que la classe minoritaire ne représente que ~ 10% de l'ense....
Supposons que je veuille itérer sur différentes valeurs avec une boucle for dans une fonction (par exemple, randomForest) for (i in c(100, 200, 500)){ randomForest(Predictor ~., data = train, ntree = i)} L'une des valeurs transmises à la fonction randomForest que je souhaite évaluer est la valeur ....
11 déc. 2018 à 00:49
Je travaille sur une classification multi-classes pour segmenter les clients en 3 classes différentes en fonction de leur comportement d'achat et de leur démographie. Je ne peux pas divulguer complètement l'ensemble de données, mais en général, il contient environ 300 fonctionnalités et 50000 lignes....
5 déc. 2018 à 17:43
Disons que j'ai 100 caractéristiques indépendantes - 90 sont binaires (par exemple 0/1) et 10 sont des variables continues (par exemple l'âge, la taille, le poids, etc.). J'utilise les 100 fonctionnalités pour prédire un problème de classificateur avec une quantité adéquate d'échantillons. Lorsque j....