Module Python fournissant un pont entre les méthodes d'apprentissage automatique de Scikit-Learn et les DataFrames de style pandas

sklearn-pandas...

Je veux récupérer les 5 enregistrements suivants après l'index spécifique. Par exemple, voici mon dataframe: Id Name code 1 java 45 2 python 78 3 c 65 4 c++ 25 5 html 74 6 css 63 7 javascript 4....
J'ai un nom Dataframe df - id year month target1 0 324 2019.0 1.0 100.0 1 325 2019.0 3.0 100.0 2 326 2019.0 10.0 100.0 3 327 2019.0 11.0 100.0 4 328 2019.0 12.0 100.0 Maintenant, je veux comparer 2 colonnes du Dataframe....
J'ai un index de séries chronologiques avec peu de variables et de lecture d'humidité. J'ai déjà formé un modèle ML pour prédire les valeurs d'humidité basées sur X, Y et Z. Maintenant, lorsque je charge le modèle enregistré à l'aide de pickle, je voudrais remplir les valeurs d'humidité manquantes e....
J'ai un ensemble de données avec beaucoup de valeurs catégorielles manquantes et je voudrais faire un imputer personnalisé qui remplira les valeurs vides avec une valeur égale à "no-variable_name". Par exemple, si une colonne "Workclass" a une valeur Nan, remplacez-la par "No Workclass". Je le fais ....
J'ai des données comme celle-ci: Je souhaite supprimer les lignes de la colonne ID_2 de l'utilisateur dont les données sont à plus et moins de 5 chiffres....
J'ai un DataFrame comme nous pouvons le voir dans le tableau A avec deux colonnes. Les valeurs de la colonne A sont int à partir de 1. Les valeurs de la colonne B sont binaires. Je dois créer la colonne C (tableau B) dans laquelle: si les valeurs de la colonne B sont 1, alors obtenez les valeurs de ....
25 janv. 2020 à 10:26
below dataframe is the output of below code i want to group rows further train=pd.read_excel("monthly_report.xlsx", sheet_name="xy12",sep=r'\s*,\s*') train['Date/Time Opened']=train['Date/Time Opened'].dt.month_name() train=train.groupby(['col1', 'Date/Time Opened'])['Date/Time Opened'].count() col....
J'ai un bloc de données comme indiqué ci-dessous Price Category Area 20 Red 100 30 Red 150 10 Red 50 25 Red NaN 30 Red NaN 10 Green 30 20 Green 60 30 ....
28 déc. 2019 à 21:03
Je veux incorporer le codage d'étiquettes via le pipeline d'apprentissage scikit. Malheureusement, LabelEncoder () est rompu avec l'API du pipeline, ce n'est donc pas une option pour le moment. J'ai essayé de créer ma propre classe qui appelle .map () pour mapper les catégories aux étiquettes: from ....
Je suis débutant en apprentissage automatique et j'ai trouvé ce qui ne va pas dans ce module erreur ... from sklearn.neighbours import KNeighborsClassifier ModuleNotFoundError: No module named 'sklearn.neighbours' ....
Ma tâche consistait à créer un modèle de classificateur pour un ensemble de données d'examen. J'ai 15000 observations de train, 5000 dev et 5000 test. La tâche a spécifié que 3 fonctionnalités devaient être utilisées: j'ai utilisé TFIDF (5000 fonctionnalités là-bas), BOW (2000 fonctionnalités supplé....
En utilisant "kmeans.cluster_centers_", j'obtiens les centroïdes finaux de chaque cluster, mais que se passe-t-il si je veux suivre tous les centroïdes de toutes les itérations et stocker le résultat dans une liste.....
from sklearn.tree import plot_tree plot_tree( model, feature_names=['IPSI','Contra','a- f','cva','tia','Diabetes','IHD','Hypertension','Arrhythmia','History'] Message d'erreur: «SyntaxError: EOF inattendu lors de l'analyse»....
Je voudrais générer une série séquentielle d'années entre deux années données avec 3 heures d'intervalle. Par exemple au format suivant année Mois Jour heure 1992 1 1 0 1992 1 1 3 Comment puis-je générer des séries chronologiques pour les 15 prochaines années dans le format ci-dessus? J'ai écrit d....
9 déc. 2019 à 19:55
Voici mon code: from sklearn.datasets import load_boston import matplotlib.pyplot as plt import numpy as np from sklearn.linear_model import LinearRegression from sklearn.model_selection import cross_val_predict from sklearn.model_selection import train_test_split %matplotlib inline boston_propert....
8 déc. 2019 à 22:52
J'utilise k pour classer les données. Et j'ai trouvé ma meilleure grappe k avec la méthode et la silhouette du coude pour valider la décision. Alors maintenant, comment puis-je classer mes données et tracer le graphique dist? Pourriez-vous s'il vous plaît m'aider avec cela? Ceci est mon code. import....
6 déc. 2019 à 21:04
Eh bien, j'ai vu quelques questions concernant load_digits (), mais toutes concernent une fonctionnalité ou une comparaison avec une autre fonction. Ce que je dois vraiment savoir, c'est ce que fait load_digits? En termes simples. S'il vous plaît ne copiez pas simplement la définition donnée dans le....
3 déc. 2019 à 19:28
J'ai récemment commencé à apprendre Python à des fins d'apprentissage automatique et j'ai rencontré un problème. J'entre des données à partir d'un fichier .csv à l'aide de Pandas et je transforme les valeurs des lignes en tableaux de nombres. J'ai besoin de passer ces tableaux en fonction sklearn. M....
Je travaille sur la construction d'un modèle de prédiction. J'ai réussi à atteindre jusqu'à obtenir les scores de validation croisée. Maintenant, je n'ai aucune idée de comment continuer. Quelle fonction dois-je utiliser pour faire des prédictions à l'aide de scores de validation croisée? X = data.i....
J'ai créé un arbre de décision très basique en utilisant la bibliothèque sklearn. Cet arbre est formé sur la base de 4 fonctionnalités: feat1 INT feat2 INT feat3 FLOAT feat4 FLOAT Et la caractéristique étiquette / cible est une valeur booléenne (0 ou 1). J'ai converti l'arborescence au format ONNX ....
J'essaie de faire une classification des sentiments et j'ai utilisé le modèle SVM sklearn. J'ai utilisé les données étiquetées pour entraîner le modèle et j'ai obtenu une précision de 89%. Maintenant, je veux utiliser le modèle pour prédire le sentiment des données non étiquetées. Comment puis je fa....
J'entraîne un modèle linéaire sur le jeu de données MNIST, mais je ne voulais m'entraîner que sur un chiffre qui est 4. Comment choisir mon X_test, X_train, y_test, y_train?....
17 nov. 2019 à 04:08
Il y a un problème d'optimisation où je dois appeler la fonction de prédiction d'un régresseur de forêt aléatoire plusieurs milliers de fois. from sklearn.ensemble import RandomForestRegressor rfr = RandomForestRegressor(n_estimators=10) rfr = rfr.fit(X, Y) for iteration in range(0, 100000): # c....
17 nov. 2019 à 00:41
J'essaie d'afficher deux tableaux côte à côte dans un cahier Jupyter. J'ai un code qui fait cela: header = ["Metric", "Test dataset"] table1 = [["accuracy", accuracy_test], ["precision", precision_test], ["recall", recall_test], ....
14 nov. 2019 à 22:46
J'ai un DataFrame qui ressemble à ceci df = pd.DataFrame([ ['a', 1], ['b', 1], ['c', 1], ['a', 2], ['c', 3], ['b', 4], ['c', 4] ], columns=['item', 'user']) Où chaque utilisateur est répété sur plusieurs lignes (avec différents éléments). Je voudrais effectuer un Lab....
16 oct. 2019 à 23:36