Pandas est une bibliothèque Python pour la manipulation et l'analyse de données, par ex. cadres de données, séries chronologiques multidimensionnelles et ensembles de données transversales que l'on trouve couramment dans les statistiques, les résultats des sciences expérimentales, l'économétrie ou la finance. Pandas est l'une des principales bibliothèques de science des données en Python.

Plus à propos pandas...

Je crée donc une série de mappages de colonnes, je peux le faire manuellement comme ceci #Produces a list of dictionaries def create_seed_dict(column, dataset): seed_col_vals = dataset[column].values.tolist() seed_col_keys =[column] * (len(seed_col_vals)) seed_col_map = list(zip(seed_col....
25 févr. 2021 à 03:18
J'ai un dataframe Pandas suivant, où je veux changer une valeur de colonne «fmc» basée sur les colonnes «time», «samples» et «uid». Le concept est le suivant: Pour le même date, if df.samples == 'C' & df.uid == 'Plot1', puis la valeur de ligne correspondante de fmc * 0.4 De même pour le même date, i....
25 févr. 2021 à 03:08
J'ai une trame de données pandas comme celle-ci: Subset Position Value 1 1 2 1 10 3 1 15 0.285714 1 43 1 1 48 0 1 89 2 1 132 2 1 152 0.285714 1 189 0.133333 1 200 0 2 1 0.133333 2 10 0 2 15 2 2 33 2 2 36 0.285714 2 72 2 2 132 0.133333 2 152 0.133....
25 févr. 2021 à 01:38
Je voudrais tracer deux graphiques circulaires l'un à côté de l'autre. Je les crée individuellement comme suit: Graphique à secteurs 1 : import matplotlib.pyplot as plt fig = plt.figure(figsize=(4,3),dpi=144) ax = fig.add_subplot(111) cts = df1.Name.value_counts().to_frame() ax.pie(cts.Name) G....
25 févr. 2021 à 00:35
J'ai une base de données d'enregistrements de noms pour lesquels j'essaie de créer des bigrammes et de transformer les bigrammes en nouvelles lignes dans le dataframe. La raison pour laquelle je fais cela est parce que certains enregistrements contiennent plusieurs noms et que certains peuvent avoi....
24 févr. 2021 à 21:36
Voici mon code pour lire plusieurs feuilles. Df = pd.read_excel ('excelfile.xls', nom_feuille = ['Feuille1', 'Feuille2', 'Feuille3']) Mais ... seule feuille1 a un en-tête. Sheet2 et sheet3 n'ont pas d'en-tête. Je vous remercie.....
24 févr. 2021 à 21:02
J'ai un DataFrame dans lequel plusieurs colonnes ont une valeur séparée par une virgule, ainsi que certaines avec des valeurs nan. Je voudrais: 0. ignorer nan divisez-les par "," garder seulement unique les trier par ordre alphabétique joindre ce qui reste en une seule série en utilisant "," pour sé....
24 févr. 2021 à 20:50
Disons que j'ai l'exemple de dataframe suivant: df = pd.DataFrame({'depth': list(range(0, 21)), 'time': list(range(0, 21)), 'metric': random.choices(range(10), k=21)}) df Out[65]: depth time metric 0 0 0 2 1 1 1 3 2 ....
24 févr. 2021 à 20:27
J'ai cette liste supprimée du site Web, je souhaite la convertir en cadre de données pandas avec des colonnes: ID, nom, PMID, source, famille, valeur, poids et les valeurs appropriées dans chaque ligne avec leur identifiant associé [['ID'], ['243'], ['Name'], ['ABC'], ['PMID'], ['--NA--'], [....
24 févr. 2021 à 20:16
Je souhaite convertir les données d'une feuille de calcul Excel en fichier JSON. Voici le code que j'ai actuellement: Données feuille de calcul Excel Code import xlrd from collections import OrderedDict import json wb = xlrd.open_workbook('./file1.xlsx') sh = wb.sheet_by_index(0) data_list = ....
24 févr. 2021 à 19:45
J'ai une colonne comme celle-ci: A B 1 000,00 2 000,00 1 400,00 2,00 1,00 2 000,00 Je veux le diviser en deux colonnes comme ceci: A B 1 000,00 2 000,00 1 400,00 2,00 1,00 2 000,00 J'ai essayé d'utiliser le crachat sur l'espace mais il se divisera à tort sur le premier es....
24 févr. 2021 à 19:04
J'ai une table comme celle-ci: +-------+-----+------+------+ |user_id|apple|good banana|carrot| +-------+-----+------+------+ | user_0| 0| 3| 1| | user_1| 1| 0| 2| | user_2| 5| 1| 2| +-------+-----+------+------+ Ici, pour chaque fruit, je souhaite obtenir la liste ....
24 févr. 2021 à 17:55
Je reçois une erreur qui plante mon programme et je ne sais pas comment la résoudre. L'erreur est là: During handling of the above exception, another exception occurred: Traceback (most recent call last): File "C:\Users\Au321103\.spyder-py3\ReadPostgreSQLMOSdata_vortex.py", line 79, in <module> cd....
24 févr. 2021 à 17:36
J'ai une simple colonne de chaînes et une liste de chaînes. strings_col "the cat is on the table" "the dog is eating" list1 = ["cat", "table", "dog"] Je dois créer une autre colonne dans laquelle chaque ligne contient la chaîne contenue dans la liste si elles sont dans string_col, si elle contient....
24 févr. 2021 à 17:14
Objectif Je veux lire dans un csv dans un dataframe DASK sans obtenir la colonne «Sans nom: 0». CODE mydtype = {'col1': 'object', 'col2': 'object', 'col3': 'object', 'col4': 'float32',} do = dd.read_csv('/folder/somecsvname.csv', dtype = mydty....
24 févr. 2021 à 14:32
J'ai un dataframe (df) qui contient 30000 lignes provenant d'un exercice de web scraping Name NameID Age John www.link.com/www.link.com/https://www.link.com/ct/John 25 Samanta www.link.com/www.link.com/https://www.link.....
24 févr. 2021 à 13:48
Comment pourrais-je titrer tous les mots sauf ceux de la liste, garder? keep = ['for', 'any', 'a', 'vs'] df.col `` 0 1. The start for one 1 2. Today's world any 2 3. Today's world vs. yesterday. Production attendue: number title 0 1 The Start for One 1 2 ....
24 févr. 2021 à 13:00
Merci d'avoir regardé cette question. Je crée une logique utilisant lambda, qui traverse toutes les lignes et compte le numéro du champ ayant une valeur sauf NA. Comme vous pouvez le voir dans l'exemple donné. Input : project_id project_a project_b project_c project_d project_e 1 ....
24 févr. 2021 à 12:55
J'essaie de lire les fichiers CSV enregistrés après chaque heure. Parfois, il manque des fichiers et ce code donne une erreur. Comment puis-je ignorer des fichiers qui n'existent pas? df_list = [] for day in range(1,int(getArgument("NUMBER_OF_DAYS"))+1,1): for hour in range(0,24,1): file_l....
24 févr. 2021 à 12:45
J'ai le dataframe suivant qui contient les données des différentes heures de début et de fin des travaux à différents intervalles. Une petite partie du dataframe est présentée ci-dessous. Dataframe (df): result | job | time START | JOB0 | 1357 START | JOB2 | 2405 END | JOB2 | 2379....
Voici le code montrant ce que je veux faire: import pandas as pd from numpy.random import randint index = pd.MultiIndex.from_product( [['a', 'b'], pd.date_range('2021-01-01', periods=3)], names=['area', 'date'] ) df = pd.DataFrame({n:randint(-5, 5, 6) for n in ('foo', 'bar')}, index=index) def....
24 févr. 2021 à 11:25
Je veux seulement les sorties où s1 et s2 ne correspondent pas. Je dois retirer toutes les données qui sont à la fois dans s1 et s2 et ne conserver que les données uniques. Voici mon code: for i in range(0,10): if s1[i] in s2.values: s1 = s1.drop([i]) print('Different values in s1:') print(s....
24 févr. 2021 à 11:22
J'essaye de convertir les valeurs de mes colonnes selon un intervalle comme, if(x<5) x=2 else if(x>=5 %% x<10) x=3 Et essayez de faire en python avec du code sur une seule ligne. Utiliser un masque et une méthode de coupe mais je ne pouvais pas le faire c'est mon procès, dataset['CURRENT_RATI....
24 févr. 2021 à 10:41
Si j'ai une liste en tant que telle, nommée "list_of_words": ['Haha', 'No', 'Why'] Et un dataframe en tant que tel: Letter Count 1 Yes 2 2 Haha 3 3 Why 4 4 No 9 5 Teeth 8 Je veux créer un dataframe résultant en tant....
24 févr. 2021 à 09:32
J'ai une trame de données en tant que telle: **A** **B** **C** **Name** Hello No Why - 2 5 303 Sir Et je veux renommer les colonnes en ajoutant la valeur de ligne au nom de la colonne: A_Hello B_....
24 févr. 2021 à 07:35