Pandas est une bibliothèque Python pour la manipulation et l'analyse de données, par ex. cadres de données, séries chronologiques multidimensionnelles et ensembles de données transversales que l'on trouve couramment dans les statistiques, les résultats des sciences expérimentales, l'économétrie ou la finance. Pandas est l'une des principales bibliothèques de science des données en Python.

pandas...

Je souhaite avoir une agrégation de style SQL en Python. # Example DataFrame df = pd.DataFrame({'ID':[1,1,2,2,2], 'revenue':[1,3,5,1,5], 'month':['2012-01-01','2012-01-01','2012-03-01','2014-01-01','2012-01-01']}) print(df) ID month revenue 0 1 201....
27 mai 2020 à 16:54
J'ai un ensemble de données qui a des attributs différents. L'un de ces attributs est la température. Ma plage de température est d'environ -30 à environ 30 degrés. Je veux faire une étude d'apprentissage automatique et je voulais regrouper la température en différents groupes. Sur un principe: en d....
27 mai 2020 à 15:26
Dans la colonne "détails", chaque entrée contient le texte "Mobile" et "Email". Je souhaite séparer le numéro de mobile et l'adresse e-mail des entrées correspondantes dans différentes colonnes individuelles à l'aide d'un code Python. Veuillez aider. Merci d'avance!....
27 mai 2020 à 14:47
J'essaie de trouver les indices de lignes qui contiennent une combinaison de plusieurs lignes en python. Veuillez trouver un code reproductible ci-dessous. df=[['Monday, 13 January 2020','',''],['Start',13588,'Jack'],['Starting','','Finish'],['','','City 1'],['Task',13589,'Finish'],['','','Address....
27 mai 2020 à 12:15
Ce sont mes dataframes: import pandas as pd from geopy.distance import geodesic df1 = pd.DataFrame({'name':['a','b','c','d'], 'lat':[37.51, 41.33,37.51, 41.33], 'long':[71.81, 77.89,71.81, 77.89]}) df2 = pd.DataFrame({'id':[1,2], 'loc_a':['a','c'],'loc_z':['b','d']}) Je veux calculer la distance ....
27 mai 2020 à 09:27
J'essaye de supprimer un caractère spécifique dans une position spécifique dans une colonne. Est-il possible de le faire avec la fonction de type de position de bande? Tout soutien est apprécié !! Merci d'avance!! Exemple df Report RPi-1 RPi-2 RPi-3 RPi-4 Je voudrais supprimer le «i» à la position ....
27 mai 2020 à 07:12
Dans l'exemple suivant df, quelle est la meilleure approche à conserver: La première ligne lorsqu'un Score apparaît pour chaque id Puis la première ligne lorsqu'une valeur change dans Score pour chaque id et supprime les lignes dupliquées jusqu'à ce qu'elle change Exemple df date id S....
27 mai 2020 à 06:30
My dataframe contient des informations sur différents États américains, et un exemple ressemble à ceci: Region ID Region Name 1112233 New York, NY 4445556 Carroll, IA Le dataframe contient 50 colonnes comme celle-ci. Comment puis-je créer un nouveau dataframe qui contient des noms de r....
26 mai 2020 à 22:10
J'ai df avec deux colonnes number et value. J'essaye de soustraire deux colonnes si la valeur est -ve Df number value 0 5 -1 1 6 5 2 3 6 3 4 -2 4 3 -3 Production attendue ....
26 mai 2020 à 19:17
J'ai ce dataframe: dict_values = {'name':['John','Peter'], 'attach':['0001-test.jpg,0002-test.jpg','0003-test.jpg']} name | attach John | 0001-test.jpg,0002-test.jpg Peter | 0003-test.jpg J'ai besoin d'obtenir la valeur avant "-" et de l'ajouter dans une liste. Comme ceci: name | attach John | ....
26 mai 2020 à 18:13
J'ai un tableau: test_arr = np.array([ [1.2, 2.1, 2.3, 4.5], [2.6, 6.4, 5.2, 6.2], [7.2, 6.2, 2.5, 1.7], [8.2, 7.6, 4.2, 7.3] ] Est-il possible d'obtenir un dataframe pandas de la forme: row_id | row1 | row2 | row3 ....
26 mai 2020 à 14:41
J'ai une colonne de dataframe avec le format suivant: col1 col2 A [{'Id':42,'prices':['30',’78’]},{'Id': 44,'prices':['20','47',‘89’]}] B [{'Id':47,'prices':['30',’78’]},{'Id':94,'prices':['20']},{'Id':84,'prices':['20','98']}] Comment puis-je le transformer en ce qui suit? col1 ....
26 mai 2020 à 12:39
Il y a ce pandas DataFrame avec des valeurs proches de 1 et proches de 0: df = pd.DataFrame({ 'colA': (0.97, 0.88, 0.03, 0.02), 'colB': (0.01, 0.03, 0.87, 0.99), }) Le trier selon des valeurs donne (le tri pour colB n'a évidemment aucun effet): df.sort_values(['colA','colB'], ascending=False) >> ....
26 mai 2020 à 10:46
Nous avons ci-dessous dataframe d1 = {'data': ['python','Python','PYTHON','conda', 'COnda', 'CONDA', ], 'Value': [50,25,30,25,40,25] } df = pd.DataFrame(d1, columns = ['data', 'Value']) data Value 0 python 50 1 Python 25 2 PYTHON 30 3 conda 25 4 COnda 40 5 CO....
26 mai 2020 à 08:42
J'essaie de fusionner plusieurs DataFrames sur le même DocID, puis de résumer les poids, mais lorsque je fusionne, cela crée Weight_x, Weight_y. Ce serait bien pour seulement deux DataFrames, mais la quantité de Dataframes à fusionner les modifications en fonction de l'entrée utilisateur, donc la fu....
26 mai 2020 à 06:18
J'essaie de gratter le Web, en utilisant Python 3, une table de ce site Web dans un fichier .csv: Calendrier national 2011-2012 de la NBA Le tableau commence comme: Revised Schedule Original Schedule Date Time Game Net Time ....
Ceci est une table similaire à celle avec laquelle je travaille A B 0 12.2 43 1 10.1 32 2 3.4 34 3 12.0 55 4 40.6 31 Et ce que j'essaie de faire, c'est de prendre certaines valeurs de la colonne A qui suivent un certain modèle et de créer une autre colonne avec de ....
26 mai 2020 à 01:08
J'essaye de nettoyer une colonne appelée «historique_rank» dans un dataframe pandas. Il contient des données de chaîne. Voici un échantillon du contenu: historical_rank ... ... 122 1908 123 O' 124 125 1911 126 1912 127 1913 * * * 2010 * * * 128 129 1914 130 ....
25 mai 2020 à 23:29
J'ai une liste: n = ['n1','n2','n3','n4','n5','n6'] Ce que je veux, c'est créer un np.array qui contient toutes les permutations de la liste. Mais il y a une limite que je veux diviser la matrice également en 3 parties dans l'ordre. Les mêmes combinaisons dans une partie n'en prendraient qu'une. Pa....
25 mai 2020 à 20:53
J'ai un df avec deux colonnes number, type. J'essaye de supprimer le nombre en position impaire si type est odd. Pour le nombre - (7,14,21,28) sans nombres en position odd - 7,21. De même - (3,10,17,24,31) sans chiffres en position odd - 3,17,31 Df df= pd.DataFrame(data = {'number' : ['7,14,21,2....
25 mai 2020 à 20:47
Je souhaite ajouter une colonne binaire à mon dataframe en fonction du fait que les colonnes données contiennent ou non NaN. J'ai essayé de le faire avec le code ci-dessous. import pandas as pd dat = pd.DataFrame({'A': [12,34,56,78, 23,None, None], 'B': [90,80,70,23,None, 78, None], 'C': [90,80,70,....
25 mai 2020 à 18:52
J'ai un df comme ça df = pd.DataFrame({'Customer ID':[1,1,1,1,1,1,2,2,2,2,2,2], 'Customer VisitNo':[1,1,1,2,2,2,1,1,1,1,2,2], 'Item Code':['A1','A1','A2','A3','A3','A1','B1','B2','B3','B3','B4','B3'], 'Item':['Ball','Ball','Bat','Glove','Glove','....
25 mai 2020 à 17:43
J'essaie de travailler sur un dataframe avec beaucoup de colonnes (505) et je veux sélectionner uniquement les 5 premières valeurs pour chaque mois. Vous trouverez ci-dessous le lien d'une image de mon DataFrame. lien photo Voici l'exemple: Dates 1 2 3 4 5 ....
25 mai 2020 à 17:09
J'ai un ensemble de données qui a une colonne de date et une colonne d'heure, j'essaie de les combiner dans une colonne DateTime mais je suis confronté à un problème avec les parties mois et date qui sont inversées Par exemple: Date Time 1/2/2019 3:29:59 PM 4/2/2019 9:15:59 AM Ces dates s....
25 mai 2020 à 16:31
J'ai une colonne qui comprend le nom de l'état et du pays: Name Region Value_1 etc. Apple Penn State 5641561 Apple Boston State 21515151 Apple United States 5545645 etc. Et je veux laisser tomber la chaîne après l'espace (""), mais je veux garder les États-Unis tels quels. Par exem....
25 mai 2020 à 13:35