Pandas est une bibliothèque Python pour la manipulation et l'analyse de données, par ex. cadres de données, séries chronologiques multidimensionnelles et ensembles de données transversales que l'on trouve couramment dans les statistiques, les résultats des sciences expérimentales, l'économétrie ou la finance. Pandas est l'une des principales bibliothèques de science des données en Python.

pandas...

J'ai un bloc de données avec trois colonnes de chaînes. Je sais que la seule valeur de la 3e colonne est valable pour chaque combinaison des deux premières. Pour nettoyer les données, je dois regrouper par bloc de données les deux premières colonnes et sélectionner la valeur la plus courante de la t....
5 mars 2013 à 15:34
J'ai un bloc de données avec une colonne et je voudrais le diviser en deux colonnes, avec un en-tête de colonne comme 'fips' et l'autre 'row' Mon dataframe df ressemble à ceci: row 0 00000 UNITED STATES 1 01000 ALABAMA 2 01001 Autauga County, AL 3 01003 Baldwin County, AL 4 ....
7 févr. 2013 à 10:30
Est-il possible d'ajouter des méta-informations / métadonnées à un DataFrame pandas? Par exemple, le nom de l'instrument utilisé pour mesurer les données, l'instrument responsable, etc. Une solution de contournement serait de créer une colonne avec ces informations, mais il semble inutile de stocke....
4 févr. 2013 à 17:59
J'ai un bloc de données avec un index hiérarchique dans l'axe 1 (colonnes) (à partir d'une opération groupby.agg): USAF WBAN year month day s_PC s_CL s_CD s_CNT tempf sum sum sum sum amax amin 0 702730 26451 1993 1 1 ....
24 janv. 2013 à 22:03
Comment convertir un objet numpy.datetime64 en datetime.datetime (ou Timestamp)? Dans le code suivant, je crée des objets datetime, timestamp et datetime64. import datetime import numpy as np import pandas as pd dt = datetime.datetime(2012, 5, 1) # A strange way to extract a Timestamp object, there'....
4 déc. 2012 à 17:08
J'ai deux dataframes pandas: from pandas import DataFrame df1 = DataFrame({'col1':[1,2],'col2':[3,4]}) df2 = DataFrame({'col3':[5,6]}) Quelle est la meilleure pratique pour obtenir leur produit cartésien (bien sûr sans l'écrire explicitement comme moi)? #df1, df2 cartesian product df_cartesian....
7 nov. 2012 à 16:33
J'ai un pandas dataframe dans lequel une colonne de chaînes de texte contient des valeurs séparées par des virgules. Je souhaite diviser chaque champ CSV et créer une nouvelle ligne par entrée (supposez que le CSV est propre et ne doit être divisé que sur ','). Par exemple, a devrait devenir b: In [....
2 oct. 2012 à 00:42
J'ai le DataFrame indexé suivant avec des colonnes et des lignes nommées, des nombres non continus: a b c d 2 0.671399 0.101208 -0.181532 0.241273 3 0.446172 -0.243316 0.051767 1.577318 5 0.614758 0.075793 -0.451460 -0.012493 Je voudrais ajouter une nouvell....
23 sept. 2012 à 23:00
J'essaie de faire ce que je pense être une opération simple dans les pandas, mais je n'arrive pas à le faire fonctionner. J'ai deux séries de pandas avec un nombre d'indices différent, je voudrais additionner des valeurs si elles partagent un indice, sinon je voudrais simplement transmettre les vale....
20 sept. 2012 à 04:02
Je voudrais fusionner deux DataFrames et conserver l'index de la première image comme index sur l'ensemble de données fusionné. Cependant, lorsque je fais la fusion, le DataFrame résultant a un index entier. Comment puis-je spécifier que je souhaite conserver l'index du bloc de données gauche? In [4....
16 août 2012 à 00:10
La plupart des opérations dans pandas peuvent être accomplies avec un chaînage d'opérateur (groupby, aggregate, apply, etc.), mais la seule façon que j'ai trouvée pour filtrer les lignes est via la normale indexation des crochets df_filtered = df[df['column'] == value] C'est peu attrayant car cela ....
8 août 2012 à 21:25
Existe-t-il un moyen préféré de conserver le type de données d'un tableau numpy fixé comme int (ou int64 ou autre), tout en ayant un élément à l'intérieur répertorié comme numpy.NaN? En particulier, je convertis une structure de données interne en un Pandas DataFrame. Dans notre structure, nous avon....
18 juil. 2012 à 22:30
J'ai un DataFrame utilisant des pandas et des étiquettes de colonne que je dois modifier pour remplacer les étiquettes de colonne d'origine. Je voudrais changer les noms de colonnes dans un DataFrame A où les noms de colonnes d'origine sont: ['$a', '$b', '$c', '$d', '$e'] À ['a', 'b', 'c', 'd', 'e....
5 juil. 2012 à 18:21
J'ai des données dans différentes colonnes mais je ne sais pas comment les extraire pour les enregistrer dans une autre variable. index a b c 1 2 3 4 2 3 4 5 Comment sélectionner 'a', 'b' et l'enregistrer dans df1? J'ai essayé df1 = df['a':'b'] df1 = df.ix[:, 'a':'b'] Aucun ....
2 juil. 2012 à 01:03
Sur la documentation Pandas de la méthode pivot, nous avons: Examples -------- >>> df foo bar baz 0 one A 1. 1 one B 2. 2 one C 3. 3 two A 4. 4 two B 5. 5 two C 6. >>> df.pivot('foo', 'bar', 'baz') A B C one 1 2 3 two 4 5 6 Mon Da....
27 juin 2012 à 21:58
J'ai deux dataframes, tous deux indexés par timeseries. J'ai besoin d'ajouter les éléments ensemble pour former un nouveau dataframe, mais seulement si l'index et la colonne sont identiques. Si l'élément n'existe pas dans l'un des dataframe, il doit être traité comme un zéro. J'ai essayé d'utiliser ....
19 juin 2012 à 22:11
J'utilise la bibliothèque pandas pour lire certaines données CSV. Dans mes données, certaines colonnes contiennent des chaînes. La chaîne "nan" est une valeur possible, tout comme une chaîne vide. J'ai réussi à faire en sorte que les pandas lisent "nan" sous forme de chaîne, mais je n'arrive pas à c....
3 juin 2012 à 04:38