Pandas est une bibliothèque Python pour la manipulation et l'analyse de données, par ex. cadres de données, séries chronologiques multidimensionnelles et ensembles de données transversales que l'on trouve couramment dans les statistiques, les résultats des sciences expérimentales, l'économétrie ou la finance. Pandas est l'une des principales bibliothèques de science des données en Python.

pandas...

Comment puis-je renommer plusieurs colonnes d'un dataframe à l'aide de leur index? Par exemple, je veux renommer les colonnes aux positions 5,6,7,8 en «cinq», «six», «sept», «huit» respectivement. Je ne veux pas entrer les clés dans le dictionnaire individuellement.....
2 juin 2020 à 23:12
J'ai un df (data frame) en Python avec avec une variable postal_code qui a des codes postaux canadiens. Tous les codes postaux sont rassemblés dans une ligne telle que k1b6j2. Mais, pour que j'utilise le package 'pgeocode', j'ai besoin du code postal sous une forme standard qui est comme k1b 6j2 (il....
2 juin 2020 à 22:06
Exemple de dataFrame: df = {'column': 'hello'} L'entrée doit être une entrée dans le dataFrame if 'hello' in df['column']: print("hello") else: print("Couldn't find entry) Ce que je voudrais comme sortie serait: Hello Cependant, la sortie se présente comme suit: Couldn't find entry J'ai vér....
2 juin 2020 à 20:16
Le contexte Je veux, pour chaque équipe, les lignes de la base de données qui contient les trois meilleurs joueurs. Dans ma tête, c'est une combinaison de Dataframe.nlargest() et Dataframe.groupby() mais je ne pense pas que cela soit pris en charge. Ma solution idéale est: effectuée directement sur ....
2 juin 2020 à 20:14
J'ai la trame de données Pandas suivante, où l'heure (durée) est donnée dans un format très étrange: Person Activity Duration 1 A 1 00:00 2 A 1 00:00 3 B 0 21:17 4 C 0 17:11 Où 1 00:00 signifie 24 heures et 0 21:17 signifie 0 jour ....
2 juin 2020 à 18:32
Salut j'ai df comme ça: df = pd.DataFrame({'CaseNo':[1,1,1,1,2,2,3,3,3,4,4], 'Category':['A','A','IOU','A','B','B','IOU','IOU','IOU','C','IOU']}) Je voudrais étiqueter CaseNo col en fonction de cette condition: Pour chaque CaseNo, s'il y a une occurrence de la valeur 'IOU' dans....
2 juin 2020 à 18:26
import pandas as pd import numpy as np url = "https://raw.githubusercontent.com/PawinData/UC/SFBA/DistanceMatrix_shortestnetworks.csv" Distance_df = pd.read_csv(url, index_col=0) D = Distance_df.to_numpy() J'ai un dataframe Distance_df et je le convertis en un tableau numpy D pour le calcul. Ce q....
2 juin 2020 à 16:53
J'ai deux trames de données df1 et df2. Les deux ont une première colonne commune SKUCode = SKU Df1: Df2: Je veux mettre à jour df1 et définir SKUStatus = 0 si SKUCode correspond à SKU dans df2. Je veux ajouter une nouvelle ligne à df1 si SKU de df2 n'a pas de correspondance avec SKUCode. Donc, ap....
2 juin 2020 à 14:13
J'essaye de faire la somme des colonnes dans un pandas df où la colonne est égale à une valeur spécifique. En utilisant le df ci-dessous, où ['X'] == 'GrV', je veux additionner les cols ('GrV A', 'GrV B'). Mais je renvoie des valeurs nan. import pandas as pd df = pd.DataFrame({ 'X' : ['GrV', 'G....
2 juin 2020 à 03:24
Est-il possible de créer un nouveau dataFrame à l'aide de pandas qui contient une ligne contenant NaN dans une colonne d'un datafram existant à examiner par une personne? Je peux obtenir des lignes contenant NaN dans une colonne spécifique avec: df_nan = df[pd.isna(df["sales_person"])] Mais y a-t-il....
1 juin 2020 à 23:48
J'ai des données au format suivant: d = {'Name': ['bob', 'george'], 'date1': ['2014/05/12:12:00:00 AM', '2014/05/15:12:00:00 AM'], 'date2': ['2014/08/31:11:59:59 PM', '2014/08/12:11:59:59 PM']} df = pd.DataFrame(data=d) Name date1 date2 0 bob 2014/05/12:1....
1 juin 2020 à 23:11
J'ai deux dataframes identiques dans pandas / python (a et b) seules les valeurs sont différentes: Une: date a1 a2 a3 01.01.2020 2 2 2 02.01.2020 3 3 3 03.01.2020 4 4 4 B: date a1 a2 a3 01.01.2020 1 1 1 01.01.2020 2 2 2 01.01.2020 3 3 3 J'ai besoin de a - b et je m'attends ....
1 juin 2020 à 21:52
Mon DF actuel ressemble à ceci Combinations Count 1 ('IDLY', 'VADA') 3734 6 ('DOSA', 'IDLY') 2020 9 ('CHAPPATHI', 'DOSA') 1297 10 ('IDLY', 'POORI') 1297 11 ('COFFEE', 'TEA') 1179 13 ('DOSA', 'VADA') 1141 15 ('CHAPPATHI', 'IDLY') 1070 16 ('....
1 juin 2020 à 20:01
Étant donné un DF: pd.DataFrame({"A":[1,2,3], "B": [{"Mon":"Closed", "Tue":"Open", "Wed":"Closed"}, {"Mon":"Open", "Tue":"Open", "Wed":"Closed"}, {"Mon":"Open", "Tue":"Open", "Wed":"Open"}] }) Comment puis-je compter le nombre de f....
1 juin 2020 à 18:45
On dirait que j'ai atteint ma limite avec les pandas sur celui-ci. Il se passe trop de choses ici pour que je puisse comprendre et je n'ai pas pu trouver de réponse sur SO. J'essaie d'effectuer une somme conditionnelle sur des groupes de lignes définis par une liste de valeurs de colonne arbitraires....
1 juin 2020 à 17:37
J'essaie de convertir une trame de données en un dict dans le format ci-dessous: df name age country state pincode 0 user1 10.0 in tn 1.0 1 user2 11.0 us tx 2.0 2 user3 12.0 eu fr 3.0 { 'user1':{'age':10,'country':'in','state':'tn','pincode':1}....
1 juin 2020 à 17:33
Quelqu'un peut-il m'aider, je suis nouveau sur Python alors supportez-moi. Mes données ressemblent à ceci, mais toutes les informations sur la région sont disponibles. J'essaie de créer une nouvelle colonne «prix réel» qui calcule le prix en fonction de la région. comme pour chaque entrée, j'ai chaq....
1 juin 2020 à 17:29
Considérez la série suivante qui représente la distance entre l'emplacement a et les emplacements b, c, d: a a 0 b 10 c 12 d 21 Maintenant, ce que j'essaye de faire est de récupérer tous les noms d'emplacement qui sont à une certaine distance de a. Par exemple, je voudrais imprimer tou....
1 juin 2020 à 16:00
Il existe un énorme dataframe contenant plusieurs types de données dans différentes colonnes. Je souhaite rechercher des lignes contenant des valeurs de date dans différentes colonnes. Voici un dataframe test: dt = pd.Series(['abc', datetime.now(), 12, '', None, np.nan, '2020-05-05']) dt1 ....
1 juin 2020 à 15:08
J'ai un dataframe de pandas df de la forme: Col1 Col2 Col3 Col4 0 True False True False 1 False False False False 2 False True False False 3 True True True True Ici, True et False sont des valeurs booléennes. J....
1 juin 2020 à 10:33
J'ai besoin d'aide pour obtenir des sorties d'un dictionnaire (python3): {'horse': ['brown', 'black'], 'duck': ['brown', 'black', 'brown', 'grey', 'brown']} Sorties requises: black horse: 1 brown horse: 1 grey horse: 0 black duck: 1 brown duck: 3 grey duck: 1 Quelqu'un peut-il offrir une solution ....
31 mai 2020 à 20:15
Voici le dataframe: State RegionName 0 NY New York 1 CA Los Angeles 2 IL Chicago 865 3 PA Philadelphia Wrin 4 AZ Phoenix City Je veux que le résultat ressemble à ceci: State RegionName 0 NY....
31 mai 2020 à 11:23
J'ai un Dataframe timedelta JC time 1 3days 21:02:05 2 1days 23:50:07 3 6days 19:28:36 Mais je veux 1 93:02:05 2 47:50:07 3 163:28:36 Comment puis-je le convertir?....
30 mai 2020 à 17:03
J'ai le dictionnaire suivant et je veux les ajouter à un dataframe pandas: crimes1 = {'SOUTHERN': 28445, 'NORTHERN': 20100, 'MISSION': 19503} Je crée le dataframe vide avec les noms de colonne que je veux: column_names = ['Neighborhood', 'Count'] crimes2 = pd.DataFrame(columns=column_names) Ensu....
30 mai 2020 à 14:49
Comment faire cette opération en utilisant des pandas? Df initial: A B C D 0 0 1 0 0 1 0 1 0 0 2 0 0 1 1 3 0 1 0 1 4 1 1 0 0 5 1 1 1 0 Df final: A B C D Param 0 0 1 0 0 1 1 0 1 0 0 0 2 0 0 1 1 2 3 0 1 0 1 0 4 1 1 0 0 1 5 1 1 1 0 0 Fondamental....
30 mai 2020 à 04:44