À utiliser pour regrouper des variables en fonction d'une condition donnée. Et seulement pour être utilisé avec pertinence pour la bibliothèque `pandas`

pandas-groupby...

Le contexte Je veux, pour chaque équipe, les lignes de la base de données qui contient les trois meilleurs joueurs. Dans ma tête, c'est une combinaison de Dataframe.nlargest() et Dataframe.groupby() mais je ne pense pas que cela soit pris en charge. Ma solution idéale est: effectuée directement sur ....
2 juin 2020 à 20:14
Je souhaite remplir NA dans mon ensemble de données en fonction de la valeur de l'autre ligne du même groupe. Les données ressemblent à ceci. group_id, start_time, end_time 1, NA, 20000 1, 40000, 20000 1, 30000, NA 2, NA, 35000 2, 45000, 22000 2, 50000,21000 2, 45000, ....
28 mai 2020 à 13:36
Nous avons ci-dessous dataframe d1 = {'data': ['python','Python','PYTHON','conda', 'COnda', 'CONDA', ], 'Value': [50,25,30,25,40,25] } df = pd.DataFrame(d1, columns = ['data', 'Value']) data Value 0 python 50 1 Python 25 2 PYTHON 30 3 conda 25 4 COnda 40 5 CO....
26 mai 2020 à 08:42
Disons que j'ai un DataFrame comme celui-ci: import pandas as pd df = pd.DataFrame({'a': [1,1,1,1,2,2,2,2], 'b': [1,2,3,4,5,6,7,8]}) Qui ressemble à ceci a b 0 1 1 1 1 2 2 1 3 3 1 4 4 2 5 5 2 6 6 2 7 7 2 8 Je voudrais inverser ses éléments dans chaque groupe , où la colonne a....
23 mai 2020 à 12:13
J'ai une trame de données pandas comme celle-ci: df = pd.DataFrame({'Person_ID': [1,1,1,1,1,1,2,2,2,3,3,3,3], 'Item_ID': [1,1,2,4,4,4,2,3,3,1,2,2,2], 'Value': [1,4,6,5,8,7,3,2,9,8,4,1,2]}) Je voudrais regrouper ceci par person_id et item_id, puis obtenir la vale....
21 mai 2020 à 01:52
J'ai une situation où j'ai besoin d'identifier si un responsable de la relation client gère des clients régionaux ou mondiaux. Désormais, un responsable peut gérer à la fois les appels régionaux et globaux, une identification est donc nécessaire si cela est vrai ou non. Les données sont au format su....
À l'aide de Pandas 1.0.1, compte tenu de cette trame de données de démonstration, je souhaite remplacer le poids et le prix des colonnes numériques par leurs valeurs médianes calculées sur la `` boîte '' du sous-groupe (sans modifier la trame de données d'origine): import pandas as pd import numpy a....
18 mai 2020 à 05:14
J'ai deux dataframes, qui ressemblent à ceci df1 = name color 0 John Blue 1 John Red 2 Lucy Green 3 Lucy Blue 4 Max Blue 2 Max White Et df2 = name value 0 John 15 1 Lucy 20 2 Max 5 J'essaie de supprimer tous les noms groupés dans df1 dont value dans df2 est ....
17 mai 2020 à 12:58
J'ai un DataFrame pandas qui ressemble à ceci: home_team away_team home_score away_score Spain Albania 0 5 Albania Spain 4 1 Albania Portugal 1 2 Albania US 0 2 Dès les deux premières lignes, nous voyons ....
10 mai 2020 à 17:30
My Pandas df is like following and want to apply groupby and then want to calculate the average and first of many columns index col1 col2 col3 col4 col5 col6 0 a c 1 2 f 5 1 a c 1 2 f 7 2 a d 1 2 g 9 3....
8 mai 2020 à 06:07
Je veux convertir mes colonnes en plusieurs tableaux de telle manière que chaque ligne ait des valeurs de la même date My data: Date Value 2006-12-11 816.2 2006-12-11 816.2 2006-12-11 816.2 2006-12-12 848.2 2006-12-12 849.0 2006-12-13 885.6 2006-12-13 887.0 2006-12-13 885.2 2006-12-1....
Probablement une question assez débutante, mais apprenant simplement à utiliser Pandas en Python. J'aimerais effectuer un groupe en utilisant des Pandas qui incluent des groupes qui ne figurent pas dans l'ensemble de données. Disons que j'ai les données suivantes: State Year Number....
4 mai 2020 à 21:21
Le problème est le suivant. Disons que nous avons un pandas df qui peut être généré en utilisant ce qui suit: month=['dec','dec','dec','jan','feb','feb','mar','mar'] category =['a','a','b','b','a','b','b','b'] sales=[1,10,2,5,12,4,3,1] df = pd.DataFrame(list(zip(month,category,sales)), ....
1 mai 2020 à 05:05
J'ai un cadre de données comme indiqué ci-dessous. Doctor Appointment Booking_ID A 2020-01-18 12:00:00 1 A 2020-01-18 12:30:00 2 A 2020-01-18 13:00:00 3 A 2020-01-18 13:00:00 4 A 2020-01-19 13:00:00 13 ....
27 avril 2020 à 19:22
J'ai un bloc de données comme indiqué ci-dessous session slot_num appt_time s1 1 2020-01-06 09:00:00 s1 2 2020-01-06 09:20:00 s1 3 2020-01-06 09:40:00 s1 3 2020-01-06 09:40:00 s1 4 2020-....
23 avril 2020 à 15:48
Considérez le dataframe d ci-dessous: d = pd.DataFrame({ 'id': ['A', 'A', 'A', 'B', 'B', 'B'], 'name': ['a', 'b', 'd', 'a', 'c', 'e'], 'value': [10, 8, 9, 11, 3, 5], }) J'ai ajouté une colonne vide d['col'] = pd.Series() donc d ressemble à: id name value col 0 A a 10....
21 avril 2020 à 18:12
Existe-t-il un moyen simple de renvoyer le groupe avec le plus de lignes par un appel à df.groupby(..)? # Return group most rows e.g. largest_group = df.groupby("community_area").max() ....
17 avril 2020 à 23:45
J'essaie de supprimer un ensemble groupé de lignes dans les pandas selon la condition suivante: Si un groupe (groupé par col1) a plus de 2 valeurs «c» dans col2, supprimez tout le groupe. Ce que j'ai ressemble à ceci col1 col2 0 A 10:10 1 A 20:05 2 A c 3 A ....
12 avril 2020 à 13:29
Je récupère des données dans l'un des fichiers dont la date est stockée en tant que 20 March En utilisant des pandas, je veux convertir en 20/03/2020 J'ai essayé d'utiliser strftime, to_datetime en utilisant des erreurs mais je n'arrive toujours pas à convertir. De plus, lorsque je regroupe par date....
9 avril 2020 à 18:54
J'ai fait ce rapport avec Tableau mais je veux essayer de faire la même chose avec Python-Pandas. Fondamentalement, je veux trouver les 3 principales sous-catégories par les ventes totales de chaque catégorie total_sales = df.groupby(['Category','Sub-Category']).agg(total_sales=('Sales','sum')).sor....
7 avril 2020 à 16:00
J'ai une trame de données qui utilise MultiIndex pour l'index et les colonnes. Par exemple: df = pd.DataFrame(index=pd.MultiIndex.from_product([[1,2], [1,2,3], [4,5]], names=['i','j', 'k']), columns=pd.MultiIndex.from_product([[1,2], [1,2]], names=['x', 'y'])) for c in df.columns: df[c] = np.ran....
3 avril 2020 à 13:29
J'importe dans une trame de données une feuille Excel qui a ses en-têtes divisés en deux rangées: Colour | NaN | Shape | Mass | NaN NaN | width | NaN | NaN | Torque green | 33 | round | 2 | 6 etc Je veux réduire les deux premières lignes en un seul en-tête: Colour | width | Shape | ....
27 mars 2020 à 05:38
J'ai le dataframe suivant: ID Days TreatmentGiven TreatmentNumber --- ---- -------------- --------------- 1 0 False NaN 1 30 False NaN 1 40 True 1 1 56 False NaN 2 0 False NaN 2 14 True ....
10 mars 2020 à 16:37
A partir de ce tableau, j'essaie d'interpoler les dates manquantes par les dates hebdomadaires min / max disponibles dans le dataframe. Ensuite, calculez l'occurrence de 0 ventes pour chaque catégorie. df=pd.DataFrame({'category_id': ['aaa','aaa','aaa','aaa','bbb','bbb','bbb','ccc','ccc'], ....
8 mars 2020 à 21:26
J'ai des données de transaction client et je voudrais supprimer les lignes où le client a retourné le produit et obtenu un remboursement. J'ai une trame de données appelée trx qui contient product_key (le code produit), les gross_sales (montant dépensé), member_id (identification du membre) et trx_d....
6 mars 2020 à 09:51