Pandas est une bibliothèque Python pour la manipulation et l'analyse de données, par ex. cadres de données, séries chronologiques multidimensionnelles et ensembles de données transversales que l'on trouve couramment dans les statistiques, les résultats des sciences expérimentales, l'économétrie ou la finance. Pandas est l'une des principales bibliothèques de science des données en Python.

Plus à propos pandas...

C'est mon code ci-dessous. Par exemple, chaque plus petit df contient 3000 lignes. def partition_df(df): partitioned_df = [] smaller_df = [] for index, row in df.iterrows(): smaller_df.append(row) if (index % 3000) == 0 and index != 0: partitioned_df.append(p....
3 oct. 2021 à 06:45
J'ai deux séries (plus grandes que l'exemple de jouet), par exemple : s1 = pd.read_json('{"count":{"1614470400000":4,"1617148800000":0,"1619740800000":0,"1622419200000":4,"1625011200000":4,"1627689600000":5,"1630368000000":0,"1632960000000":8,"1635638400000":2}}')['count'] s2 = pd.read_json('{"count....
3 oct. 2021 à 04:46
Mon ensemble de données comporte 10 colonnes, dont l'une contient des textes sous forme de listes de chaînes. Base de données: Col1 Col2 Col3 Text ... ... ... ['I','have', 'a','dream'] ... ... ... ['My', 'mom', 'is','Spanish'] Le code wordcloud = WordCloud(stopwords=stopwords, max_font_size=5....
3 oct. 2021 à 03:48
J'ai écrit une fonction qui demande à un utilisateur le nom de la colonne (ex. 'Age') ou le numéro de la colonne (0, 1, ... ou -1, -2, ...) et le renvoie s'il existe. J'aimerais savoir si ma solution peut être améliorée en termes de conception de code. Pour clarifier, j'ai besoin de ce morceau de c....
3 oct. 2021 à 00:40
J'ai un fichier FASTA qui ressemble à ceci >Spike|hCoV-19/Wuhan/WIV04/2019|2019-12-30|EPI_ISL_402124|Original|hCoV-19^^Hubei|Human|Wuhan Jinyintan Hospital|Wuhan Institute of Virology|Shi|China MFVFLVLLPLVSSQCVNLTTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHSTQDLFLPFFSNVTWFHAIHVSGTNGTKRFDNPVLPFNDGVYFASTEKSNIIRGWIF....
2 oct. 2021 à 22:01
J'ai le dataframe suivant: dictionary = {'Monday': {'John': 5, 'Lisa': 1, 'Karyn': 'NaN', 'steve': 1, 'ryan': 4, 'chris': 5, 'jessie': 6}, 'Friday': {'John': 0, 'Lis....
2 oct. 2021 à 19:58
Si j'ai une trame de données comme celle-ci: A B C D E F ------------------ 1 2 3 4 5 6 1 1 1 1 1 1 0 0 0 0 0 0 1 1 1 1 1 1 Comment puis-je obtenir le nombre de lignes qui ont la valeur 1 dans chaque colonne ? Dans ce cas, 2 lignes ont 1 dans chaque champ. Je connais....
2 oct. 2021 à 17:52
Je souhaite extraire les valeurs de la liste afin de pouvoir effectuer une opération de pandas sur la chaîne. Distance TGR Grade TGR1 [342m, 342m, 530m, 342m] [M, M, RW, RW] [1, 1, 7, 1] [390m, 390m, 390m, 390m,450] [M, 7, 6G, X45, X67....
2 oct. 2021 à 11:28
Disons que j'ai la trame de données suivante: import pandas as pd series = [('Stranger Things', 3, 'Millie'), ('Game of Thrones', 8, 'Emilia'), ('La Casa De Papel', 4, 'Sergio'), ('Westworld', 3, 'Evan Rachel'), ('Stranger Things', 3, 'Todd'), ('L....
2 oct. 2021 à 00:46
J'essaie de supprimer des caractères dans une colonne df à gauche et à droite des mots clés qui se répètent sans cesse dans les lignes d'un grand DF. Il y a aussi des nombres de tête qui changent donc ce n'est pas si facile. Mes données ressemblent à ceci : 128544 20210831 2200 882.2 3....
1 oct. 2021 à 23:26
J'ai une série de listes et j'aimerais indexer le premier élément de chaque liste dans un bloc de données de listes à l'aide de pandas. Comment puis-je faire ceci? Exemple pratique Mon jeu de données d'origine est un bloc de données pandas qui ressemble à : # Import raw dataset from URL url = 'h....
1 oct. 2021 à 20:18
J'ai deux dataframes, 'inp' et 'IndiRelat'. Les 'inp' sont les entrées de certaines données. import pandas as pd inp = [[2, 'cvt' , -3, 5, 17, -2, -9, -0.2, 'RL'], [2, 'cv' , 0, 0, 0, 0, 0, 0, 'LL'], [2, 'sope' , 0, 0, 0, 0, 0, 0, 'SD'], [2, 'wix+' ,-13,-13....
1 oct. 2021 à 19:04
J'ai ces deux tableaux : (deux exemples de tableaux aléatoires créés) x = [5,12,24,44,22,32,22] y = [8,14,26,47,44,35,23] Ces deux colonnes sont liées et x[4] et y[4] sont les valeurs aberrantes de ces données Comment puis-je parcourir un bloc de données et renvoyer les colonnes ou les numéros de c....
1 oct. 2021 à 18:06
Version Spark : 2.3.0 J'ai une trame de données PySpark qui a une colonne Array et je souhaite filtrer les éléments du tableau en appliquant des conditions de correspondance de chaîne. Ex : si j'avais un dataframe comme celui-ci Array Col ['apple', 'banana', 'orange'] ['strawberry', 'raspber....
J'essaie d'implémenter une barre de progression dans mon code pendant qu'il lit mon fichier csv (et j'aimerais également l'implémenter dans les autres fonctions). Cependant, je ne sais pas comment implémenter ce code dans mon code de lecture, car il continue de progresser et ne se termine jamais imp....
1 oct. 2021 à 15:45
Bien que le tracé de la ligne se présente bien, je cherche un moyen plus efficace d'écrire ce code et de le raccourcir. Quelles seraient les « meilleures pratiques » ? Nouveau mec travaillant sur les fondations. J'ai l'impression que je devrais utiliser une boucle pour attribuer toutes les valeur....
1 oct. 2021 à 14:03
J'essaie de créer un bloc de données qui ne contient que certaines colonnes d'un bloc de données précédemment créé à l'aide d'une boucle. J'ai le dataframe suivant: Time Amount Amount i=2 Amount i=3 Amount i=4 0 20 10 20 20 20 1 10 5 10 ....
25 sept. 2021 à 14:32
J'ai un DataFrame avec 3 colonnes : POD (qui est un code), timestamp, EAI_ALL (nombre). Je veux calculer une 4ème colonne où chaque ligne a la valeur suivante : la valeur de EAI_ALL de la ligne actuelle moins la valeur de EAI_ALL de la ligne précédente. Cela doit être fait pour chaque code (par ex....
J'essaie d'exécuter le code suivant en Python. Ce à quoi je m'attends, c'est que le code lira dans le fichier Excel, supprimera les lignes 1 et 2, puis imprimera les premières lignes de données sur la console : import pandas as pd path = 'C:\\Temp\\' filename = 'datafile1.xlsx' df = pd.read_exc....
25 sept. 2021 à 10:13
J'ai 2 fichiers csv avec des nombres aléatoires, comme suit : Csv1.csv 0 906018 1 007559 2 910475 3 915104 4 600393 ... 5070 907525 5071 903079 5072 001910 5073 909735 5074 914861 length 5075 Csv2.csv 0 5555 1 7859 2 501....
25 sept. 2021 à 03:00
J'ai ce df: CODE STATION PLACE SECTOR ALTITUDE MONTH YEARS_OF_STATION 0 103036 NaN TUMBES COSTA NORTE 70 ENE 27 1 103036 NaN TUMBES COSTA NORTE 70 ENE 27 2 103036 ....
22 sept. 2021 à 04:16
J'ai deux pandas DataFrames, où le premier DataFrame a deux colonnes : "a" et "id" et le deuxième DataFrame a deux colonnes : "id" et "color_value". Je voudrais comparer les identifiants entre les deux DataFrames et s'il y a une correspondance, ajouter une colonne au premier DataFrame avec la bonne....
21 sept. 2021 à 23:18
J'ai un cadre de données pandas avec une colonne de type d'objet qui a des valeurs de profilage par utilisateur comme ceci : print(df[profile_values]) 1 [\n "ab",\n "abc",\n "abcd"\n] 1 NaN 3 [\n "ab",\n "abcd"\n] 4 NaN 5 [\n "ab"\n] ... Besoin de couper les valeurs ou de change....
21 sept. 2021 à 21:24
Supposons que j'ai des données quotidiennes de 2010 à 2020 : Ex: Date col1 2010-01-01 False 2010-01-02 False ... 2020-12-31 False Je veux définir col1 = True pour toutes les lignes, où (le mois est égal à 4 et le jour est supérieur à 25) et le mois est égal à 5 ​​et le ....
21 sept. 2021 à 21:13
J'ai atteint une impasse en essayant de regrouper les enregistrements dans mon df et d'empiler les valeurs de l'une des colonnes. J'ai un enregistrement df de ~ 390k d'une telle forme: df = pd.DataFrame({ 'Województwo': {14: 'ŁÓDZKIE', 15: 'ŁÓDZKIE'}, 'Powiat': {14: 'bełchatowski', 15: 'beł....
21 sept. 2021 à 20:45