Pandas est une bibliothèque Python pour la manipulation et l'analyse de données, par ex. cadres de données, séries chronologiques multidimensionnelles et ensembles de données transversales que l'on trouve couramment dans les statistiques, les résultats des sciences expérimentales, l'économétrie ou la finance. Pandas est l'une des principales bibliothèques de science des données en Python.

pandas...

Quelqu'un peut-il m'aider, je suis nouveau sur Python alors supportez-moi. Mes données ressemblent à ceci, mais toutes les informations sur la région sont disponibles. J'essaie de créer une nouvelle colonne «prix réel» qui calcule le prix en fonction de la région. comme pour chaque entrée, j'ai chaq....
1 juin 2020 à 17:29
Considérez la série suivante qui représente la distance entre l'emplacement a et les emplacements b, c, d: a a 0 b 10 c 12 d 21 Maintenant, ce que j'essaye de faire est de récupérer tous les noms d'emplacement qui sont à une certaine distance de a. Par exemple, je voudrais imprimer tou....
1 juin 2020 à 16:00
Il existe un énorme dataframe contenant plusieurs types de données dans différentes colonnes. Je souhaite rechercher des lignes contenant des valeurs de date dans différentes colonnes. Voici un dataframe test: dt = pd.Series(['abc', datetime.now(), 12, '', None, np.nan, '2020-05-05']) dt1 ....
1 juin 2020 à 15:08
J'ai un dataframe de pandas df de la forme: Col1 Col2 Col3 Col4 0 True False True False 1 False False False False 2 False True False False 3 True True True True Ici, True et False sont des valeurs booléennes. J....
1 juin 2020 à 10:33
J'ai besoin d'aide pour obtenir des sorties d'un dictionnaire (python3): {'horse': ['brown', 'black'], 'duck': ['brown', 'black', 'brown', 'grey', 'brown']} Sorties requises: black horse: 1 brown horse: 1 grey horse: 0 black duck: 1 brown duck: 3 grey duck: 1 Quelqu'un peut-il offrir une solution ....
31 mai 2020 à 20:15
Voici le dataframe: State RegionName 0 NY New York 1 CA Los Angeles 2 IL Chicago 865 3 PA Philadelphia Wrin 4 AZ Phoenix City Je veux que le résultat ressemble à ceci: State RegionName 0 NY....
31 mai 2020 à 11:23
J'ai un Dataframe timedelta JC time 1 3days 21:02:05 2 1days 23:50:07 3 6days 19:28:36 Mais je veux 1 93:02:05 2 47:50:07 3 163:28:36 Comment puis-je le convertir?....
30 mai 2020 à 17:03
J'ai le dictionnaire suivant et je veux les ajouter à un dataframe pandas: crimes1 = {'SOUTHERN': 28445, 'NORTHERN': 20100, 'MISSION': 19503} Je crée le dataframe vide avec les noms de colonne que je veux: column_names = ['Neighborhood', 'Count'] crimes2 = pd.DataFrame(columns=column_names) Ensu....
30 mai 2020 à 14:49
Comment faire cette opération en utilisant des pandas? Df initial: A B C D 0 0 1 0 0 1 0 1 0 0 2 0 0 1 1 3 0 1 0 1 4 1 1 0 0 5 1 1 1 0 Df final: A B C D Param 0 0 1 0 0 1 1 0 1 0 0 0 2 0 0 1 1 2 3 0 1 0 1 0 4 1 1 0 0 1 5 1 1 1 0 0 Fondamental....
30 mai 2020 à 04:44
Je dois détecter et empêcher toute donnée non numérique d'entrer dans ma trame de données. Exemple: value in out transf inc buy 0 208372 4206.84 4692.22 215976 725.41 105339.92 1 abs 0.00 1270.28 13602 1151.29 0.00 2 230172 0.....
30 mai 2020 à 03:40
Voici mon problème: J'ai un dataFrame qui ressemble à ceci: Date Name Score Country 2012 Paul 45 Mexico 2012 Mike 38 Sweden 2012 Teddy 62 USA 2012 Hilary 80 USA 2013 Ashley 42 France 2013 Temari 58 UK 2013 Harry 78 UK 2013 Silvia 55 Italy Je souh....
30 mai 2020 à 02:39
J'ai l'exemple suivant df: col1 col2 col3 doc_no 0 a x f 0 1 a x f 1 2 b x g 2 3 b y g 3 4 c x t 3 5 c y t 4 ....
30 mai 2020 à 02:09
Envisagez une trame de données Pandas comme: >>> import pandas as pd >>> df = pd.DataFrame(dict(url=['http://url1.com', 'http://www.url1.com', 'http://www.url2.com','http://www.url3.com','http://www.url1.com'])) >>> df Donnant: url 0 http://url1.com 1 http://www.url1.com 2 ....
29 mai 2020 à 18:36
J'ai un ensemble de données, qui a malheureusement des valeurs DateTime sporadiques, plutôt que int ou str. Comment pourrais-je modifier les valeurs, en parcourant la base de données et en remplaçant le 2019-05-03 00:00:00 par 5-3, par exemple? J'ai essayé quelques boucles for mais en vain. Existe-t....
29 mai 2020 à 17:12
J'ai un dataframe (df) avec 2 colonnes principales - une appelée «TIMESTAMP» représentant les dates, et une appelée «QC» reflétant les drapeaux de contrôle de qualité comme des ints. Ce df a environ 40 000 lignes, donc je ne veux pas parcourir chacune d'elles. J'ai un nouveau dataframe (dfNew) avec ....
29 mai 2020 à 11:00
Dans le dataframe que j'ai, il y a tellement de colonnes dont je n'ai besoin que de quelques-unes. Par exemple Col_A Col_B Col_C Col_D Col_E Col_F ... ... ... ... ... ... ... Je n'ai besoin que des colonnes Col_A, Col_C and Col_E do....
29 mai 2020 à 08:41
Mon dataframe- df= pd.DataFrame({'A':[33,-44],'B':[44,-66],'C':[66,21]}) Je veux trouver la moyenne absolue par ligne (en ignorant les signes) et la formule pour prendre la moyenne sera par exemple- Pour la première rangée- (33+ 44/2 + 66/3)/3 = 25.6 Pour la deuxième rangée (44+66/2+21/3)/3=24.3 ....
29 mai 2020 à 07:01
Comment supprimer toutes les colonnes avec une valeur NaN des dataframes? count bal NaN NaN sum NaN 0 10.534709 254.38 0 215490.85 -7118.52 2013-07-31 1 0.000000 135.39 0 227822.73 -10034.44 2013-08-31 2 0.000000 143.58 0 247432.23 -....
29 mai 2020 à 05:42
Je souhaite créer une nouvelle colonne basée sur les conditions suivantes: si la ligne contient dogs / dog / chien / chiens, alors ajoutez -00 si la ligne contient chats / chat / chat / chats, ajoutez 00- Un échantillon de données est le suivant: Animal 22 dogs 1 dog 1 cat 3 dogs 32 chats Et jusq....
28 mai 2020 à 22:43
Je souhaite créer une nouvelle trame de données pandas à colonne unique à l'aide d'un tableau numpy 2D. Apparemment, chaque ligne devrait contenir des listes 1D. Voici un exemple reproductible simplifié. import pandas as pd import numpy as np arr = np.ones((4,3)) # could be any 2D array Ce que je ....
28 mai 2020 à 22:21
Étant donné une base de données pandas df = pd.DataFrame({'a': [1,2,3,4,5,6,7,8], 'b': [0,0,1,1,2,2,3,3]}) Comment le trier le long de la colonne b de manière à ce qu'il soit réorganisé en {0,1,2,3,0,1,2,3}. C'est à dire. le dataframe résultant est 1 0 3 1 5 2 7 3 2 0 4....
28 mai 2020 à 22:15
Mon dataframe comporte de nombreuses colonnes. Deux d'entre eux sont first et last, qui contiennent respectivement des listes de noms et prénoms. Certains des noms sont manquants et ont des chaînes vides à leur place. Mais le premier élément de la liste first correspond au premier élément de la list....
28 mai 2020 à 21:00
J'ai un cas d'utilisation où j'ai dis 10 cols dont 5 commencent par la chaîne 'Region'. J'ai besoin d'obtenir un dataframe résultant qui ne contient que ces cols (commençant par la chaîne 'Region'). Non seulement cela, je dois m'assurer que l'ordre est préservé (par exemple, si dans le df d'origine,....
28 mai 2020 à 17:35
Le but de ce script est de produire un bloc de données qui est généré par le code écrit dans le style orienté objet. Le problème est que le résultat de ce script est une trame de données vide. Il n'y a pas d'erreur. Voici le code: import pandas as pd class Dataframe: def __init__(self): ....
28 mai 2020 à 14:40
Je souhaite remplir NA dans mon ensemble de données en fonction de la valeur de l'autre ligne du même groupe. Les données ressemblent à ceci. group_id, start_time, end_time 1, NA, 20000 1, 40000, 20000 1, 30000, NA 2, NA, 35000 2, 45000, 22000 2, 50000,21000 2, 45000, ....
28 mai 2020 à 13:36