À utiliser pour regrouper des variables en fonction d'une condition donnée. Et seulement pour être utilisé avec pertinence pour la bibliothèque `pandas`

Plus à propos pandas-groupby...

J'ai une table en CSV comme ceci: CSV de base Et j'ai besoin de le grouper comme ceci: Dans tous mes CONCURSO, seuls les changements CIDADE et UF. Attendu CSV J'essaye ce code mais cela ne fonctionne pas. Pouvez-vous les gars .......
17 mars 2021 à 03:29
Ci-dessous un extrait de mon Pandas DataFrame: case_id start_time end_time nom_segment durée 0 0.0 02/06/2016 02/06/2016 A_Create Application | .......
16 mars 2021 à 18:05
J'ai créé une fonction permettant de lire le fichier CSV COVID-19 à partir d'une URL, de supprimer certaines fonctionnalités et de regrouper par nom de pays / région. Je veux que cette fonction utilise DataFrame.melt pour garder `` Pays / Région '' constant et .......
16 mars 2021 à 18:02
J'ai du mal à appliquer une logique à l'ensemble de mon ensemble de données. Je suis capable d'appliquer la logique sur un petit "groupe" mais pas sur tous les groupes (attention, les groupes sont constitués par primaryFilter et .......
16 mars 2021 à 15:25
J'essaie de résumer la colonne sous-séculaire en contrôlant l'année et le téléscripteur dans le tableau ci-dessous. Telle que, une nouvelle colonne à créer et la somme de df.subsec à ajouter ici. la table j'ai la table dont j'ai besoin .......
16 mars 2021 à 04:07
Salut donc j'ai dataframe comme celui-ci, qui a 71 valeurs uniques dans la colonne de temps, 721 valeurs uniques dans la colonne lat, 1440 valeurs uniques dans la colonne lon et toutes les valeurs dans la colonne temporaire sont uniques. Trame de données .......
H, j'ai un ensemble de données avec deux colonnes, l'une d'elles est target. Si je regroupe toutes les valeurs uniques dans target, j'obtiens un tableau d'éléments 826. Mon problème est lorsque j'essaie d'attribuer des valeurs basées sur cette unicité. J'ai un deuxième tableau, appelé array avec c....
14 mars 2021 à 18:29
J'essaie de calculer certains éléments groupés en utilisant la bibliothèque d'analyse technique (TA-lib) ici: https://mrjbq7.github.io/ta-lib/ Certaines des fonctions telles que AROON généreront deux variables, AR_UP et. ......
14 mars 2021 à 07:38
Je veux groupby et agréger pour passer de la première cellule à la deuxième cellule dans l'image ci-dessous (la méthode d'agrégation est moyenne).....
13 mars 2021 à 08:12
J'ai un exemple de dataframe comme ci-dessous. J'ai besoin de trouver le résultat selon la condition ci-dessous. Prix ​​du volume Datetime 2020-08-05 09:15:00 1033504 2020-08-05 09:15:00 1960 .......
Impossible de regrouper par colonne et de renvoyer le nom du service, avec respectivement le nombre d'employés et l'échelle de salaire. Le DataFrame réel est: Name Dept Salary RcvDate 0 Vertie IT 3000 2018-08-05 1 Charlsie IT 2000 2018-08-05 2 Manual ....
Ceci est un exemple de mon dataframe et je voudrais appliquer la fonction 'groupby' mais j'obtiens le résultat suivant: Exemple de dataframe: x temps d'échantillonnage y 1 matin 19 2 .......
12 mars 2021 à 13:49
Je voudrais exécuter une fonction sur un ensemble de nombres après un groupby, mais cette fonction ne fonctionne que lorsqu'une certaine condition est remplie. Existe-t-il un moyen d'effectuer deux opérations différentes? Disons que nous voulons .......
J'ai le tableau suivant à partir du téléchargement des données boursières téléchargées pour plusieurs stocks. J'ai utilisé le code suivant i = ['NTPC.NS', 'GAIL.NS'] stock = yf.download (tickers = i, start = '2021-01-11', end = '2021 -.......
11 mars 2021 à 13:40
J'ai une table avec plusieurs colonnes. Pour l'une des colonnes AC , je dois la remplacer par Résultat AC comme indiqué dans le tableau ci-dessous La fonction a un pseudo code comme ci-dessous: For each unique address: If # of unique(AC) < Value in column B AND len(Top 1 (unique(AC))) != len(....
10 mars 2021 à 23:34
J'ai un ensemble de données, df, dans lequel je voudrais regrouper par une colonne, révéler les décomptes de chaque valeur unique et afficher la colonne appropriée. emplacement de l'ID de données e-db ny e-db ny e-db ny f-a ny .......
10 mars 2021 à 22:40
J'espère que je pose cette question de la bonne manière - merci à la personne qui a signalé mes erreurs plus tôt. J'ai une base de données (dft) de codes de stock avec des prix, par exemple: Date d'ouverture .......
Je veux obtenir la distance de la semaine de pointe et créer une nouvelle variable, cette semaine de pointe est basée sur les ventes. Par exemple, l'ID "ppr5007288231" a un pic de semaine 3 alors que dans la nouvelle variable, la semaine 3 serait 0 et la semaine précédente et la semaine ultérieure a....
9 mars 2021 à 17:24
Après avoir effectué le prochain groupby () data.groupby(["Gender",'Gain/Loss',"Final corrected classification"]).size() Gender Gain/Loss Final corrected classification Female Gain Benign 5619 Likely Benign 7288 ....
9 mars 2021 à 15:24
J'ai de grandes données, je veux compter, additionner, moyenne pour chaque ligne uniquement entre une plage spécifique. df = pd.DataFrame({'id0':[10.3,20,30,50,108,110],'id1':[100.5,0,300,570,400,140], 'id2':[-2.6,-3,5,12,44,53], 'id3':[-100.1,4,6,22,12,42]}) id0 id1 id2 id3 0 10.3 ....
7 mars 2021 à 17:02
Avoir le DF suivant: A B 0 1 11 1 2 22 2 2 22 3 3 33 4 3 33 Je voudrais grouper par «A» puis prendre les n premiers groupes et en créer une nouvelle trame de données. J'ai regardé autour de moi et j'ai trouvé cette réponse: result = [g[1] for g in list(grouped)[:3]] Mais la solutio....
7 mars 2021 à 14:05
J'ai un dataframe import pandas as pd df = pd.DataFrame({ 'ID': [1, 1, 1, 2, 2, 2], 'value': [100, 120, 130, 200, 190, 210], 'value2': [2100, 2120, 2130, 2200, 2190, 2210], 'state': ['init','mid', 'final', 'init', 'mid', 'final'], }) Je veux ajouter une autre ligne, qui est la différence de «....
Je travaille avec un DataFrame pour créer une distribution de fréquence en comptant les trois types de valeurs dans une colonne. Dans cet exemple, je compte et affiche le "statut personnel" de chaque personne. Lorsque j'exécute le code, toutes les autres colonnes sont affichées avec le décompte ré....
Je me demande si le comportement d'application de rolling sur un objet groupby avec un MuliIndex décrit ci-dessous est attendu. Le problème est que l'utilisation de rolling directement sur groupby ne conserve pas le MultiIndex. Cependant, l'utilisation de apply sur groupby conserve l'index. df = p....
5 mars 2021 à 15:13
Je veux compter si le nombre est supérieur à 0,1, puis les regrouper par mois-année pour voir quel mois-année a le plus de jours avec plus de 0,1 variations. J'ai un df comme celui-ci avec des données quotidiennes mais ne montrant que l'indice mois-année. table = df.pivot_table(df, columns=['btc','....