Un bloc de données est une structure de données tabulaire. Habituellement, il contient des données où les lignes sont des observations et les colonnes sont des variables de différents types. Alors que "data frame" ou "dataframe" est le terme utilisé pour ce concept dans plusieurs langues (R, Apache Spark, deedle, Maple, la bibliothèque pandas en Python et la bibliothèque DataFrames en Julia), "table" est le terme utilisé dans MATLAB et SQL.

dataframe...

J'ai un data.frame all_data avec plusieurs colonnes, comme celui-ci VoS Value Total.Value 1 NA NA NA NA 41 NA 13 NA 76 NA NA 4 NA NA NA ....
3 juin 2020 à 23:53
J'ai un code df1 = pd.read_excel('DIRECTORY\\file.xlsm', sheetname='Resume', header=1, usecols='A:I') #some operations bf1 =pd.read_excel('DIRECTORY\\file.xlsm', sheetname='Resume', header=1, usecols='K:P') #some operations Final_file = pd.concat([df1,bf1], ignore_index=True) Notez que df et bf li....
3 juin 2020 à 14:57
J'essaye de nettoyer un grand ensemble de données. Un échantillon de l'ensemble de données montre: Player Name Headline 0 LeBron James Woj: NBA. ESPN planning for a H-O-R-S-E tourna... 1 LeBron James LeBron James suggests 5-10 games before playoffs 2 ....
3 juin 2020 à 01:47
J'ai un dataframe python et certaines colonnes font référence à des échantillons répétés comme ci-dessous: In [3]: df = pd.DataFrame( ...: [[89, 89, 12, 34, 32], ...: [788, 25, 55, 65, 55], ...: [588, 23, 58, 8, 55], ...: [25, 14, 45, 123, 58]], ...: columns = [....
3 juin 2020 à 01:00
Je veux trier certaines colonnes dans une grande trame de données Pandas. Ces colonnes sont au milieu de df et à la fin. Ils commencent par "R" columns_list = df.columns.tolist() columns_list Out[17]: ['Id', 'Name', 'Surname', 'Radius', 'Ship', 'Country', 'Spacecraft', 'Planet', 'ExtraterrestialSup....
2 juin 2020 à 23:42
Comment puis-je renommer plusieurs colonnes d'un dataframe à l'aide de leur index? Par exemple, je veux renommer les colonnes aux positions 5,6,7,8 en «cinq», «six», «sept», «huit» respectivement. Je ne veux pas entrer les clés dans le dictionnaire individuellement.....
2 juin 2020 à 23:12
import pandas as pd import numpy as np url = "https://raw.githubusercontent.com/PawinData/UC/SFBA/DistanceMatrix_shortestnetworks.csv" Distance_df = pd.read_csv(url, index_col=0) D = Distance_df.to_numpy() J'ai un dataframe Distance_df et je le convertis en un tableau numpy D pour le calcul. Ce q....
2 juin 2020 à 16:53
J'ai deux trames de données df1 et df2. Les deux ont une première colonne commune SKUCode = SKU Df1: Df2: Je veux mettre à jour df1 et définir SKUStatus = 0 si SKUCode correspond à SKU dans df2. Je veux ajouter une nouvelle ligne à df1 si SKU de df2 n'a pas de correspondance avec SKUCode. Donc, ap....
2 juin 2020 à 14:13
J'ai le jeu de données suivant structure(list(a = c(2, 1, 9, 2, 9, 8), b = c(4, 5, 1, 9, 12, NA), c = c(50, 34, 77, 88, 33, 60)), class = "data.frame", row.names = c(NA, -6L)) a b c 1 2 4 50 2 1 5 34 3 9 1 77 4 2 9 88 5 9 12 33 6 8 NA 60 De la colonne b, je ne veux que des valeurs compri....
2 juin 2020 à 13:19
J'ai un dataframe df avec une colonne appelée columnList comme str. "1 2,7 8,10 7" Ensuite, je les ai convertis en une liste comme indiqué: [1 2,7 8,10 7] Je veux convertir la valeur dans la liste en tuple: [(1,2),(7,8),(10,7)] Code actuel: temp = df['columnList'].str.split(',') result = list(zip....
2 juin 2020 à 05:16
Est-il possible de créer un nouveau dataFrame à l'aide de pandas qui contient une ligne contenant NaN dans une colonne d'un datafram existant à examiner par une personne? Je peux obtenir des lignes contenant NaN dans une colonne spécifique avec: df_nan = df[pd.isna(df["sales_person"])] Mais y a-t-il....
1 juin 2020 à 23:48
J'ai des données au format suivant: d = {'Name': ['bob', 'george'], 'date1': ['2014/05/12:12:00:00 AM', '2014/05/15:12:00:00 AM'], 'date2': ['2014/08/31:11:59:59 PM', '2014/08/12:11:59:59 PM']} df = pd.DataFrame(data=d) Name date1 date2 0 bob 2014/05/12:1....
1 juin 2020 à 23:11
J'ai un fichier CSV avec 19 colonnes et 9 lignes sur la moyenne des mois de pluie à partir de pluviomètres et de leurs coordonnées (LongLat). Les colonnes sont des moyennes et les lignes sont les pluviomètres. Le fichier CSV peut être consulté ici: https: // drive. google.com/file/d/1wGVT5etZomYW-Cb....
1 juin 2020 à 16:57
Il existe un énorme dataframe contenant plusieurs types de données dans différentes colonnes. Je souhaite rechercher des lignes contenant des valeurs de date dans différentes colonnes. Voici un dataframe test: dt = pd.Series(['abc', datetime.now(), 12, '', None, np.nan, '2020-05-05']) dt1 ....
1 juin 2020 à 15:08
J'ai un fichier texte comme ci-dessous 1234_4567_DigitalDoc_XRay-01.pdf 2345_5678_DigitalDoc_CTC-03.png 1234_5684_DigitalDoc_XRay-05.pdf 1234_3345_DigitalDoc_XRay-02.pdf J'attends la sortie comme | catg|sub_catg| doc_name |revision_label|extension| |1234| 4567|DigitalDoc_XRay-01.pdf....
1 juin 2020 à 13:26
J'ai un Dataframe timedelta JC time 1 3days 21:02:05 2 1days 23:50:07 3 6days 19:28:36 Mais je veux 1 93:02:05 2 47:50:07 3 163:28:36 Comment puis-je le convertir?....
30 mai 2020 à 17:03
J'ai les données suivantes > df X1 X2 X3 1 3 4 1 0 0 1 1 0 Et je veux fusionner toutes les colonnes afin que la sortie finale soit new colName 1 X1 1 X1 1 X1 3 X2 0 X2 1 X2 4 X3 0 X3 0 X3 Merci d'avance.....
30 mai 2020 à 09:50
Comment faire cette opération en utilisant des pandas? Df initial: A B C D 0 0 1 0 0 1 0 1 0 0 2 0 0 1 1 3 0 1 0 1 4 1 1 0 0 5 1 1 1 0 Df final: A B C D Param 0 0 1 0 0 1 1 0 1 0 0 0 2 0 0 1 1 2 3 0 1 0 1 0 4 1 1 0 0 1 5 1 1 1 0 0 Fondamental....
30 mai 2020 à 04:44
J'ai un fichier texte qui contient des données de la forme suivante: {"id": 1, {"device_data": 123}, "created_at": "2020-04-03"}{"id": 2, {"device_data": 123}, "created_at": '2020-04-03'}{"id": 2, {"device_data": 123}, "created_at": "2020-04-03"}{"id": 2, {"device_data": 123}, "created_at": '2020-04....
30 mai 2020 à 01:29
Supposons que j'ai l'objet zoo suivant: x.orig <- read.zoo(data.frame(date=seq(as.Date('2020-01-01'), as.Date('2020-01-10'), 1), v=c(1,2,3,100,4,5,1000,8,8,10))) 2020-01-01 2020-01-02 2020-01-03 2020-01-04 2020-01-05 2020-01-06 2020-01-07 2020-01-08 2020-01-09 2020-01-10 1 2 ....
29 mai 2020 à 23:09
Envisagez une trame de données Pandas comme: >>> import pandas as pd >>> df = pd.DataFrame(dict(url=['http://url1.com', 'http://www.url1.com', 'http://www.url2.com','http://www.url3.com','http://www.url1.com'])) >>> df Donnant: url 0 http://url1.com 1 http://www.url1.com 2 ....
29 mai 2020 à 18:36
J'ai un ensemble de données, qui a malheureusement des valeurs DateTime sporadiques, plutôt que int ou str. Comment pourrais-je modifier les valeurs, en parcourant la base de données et en remplaçant le 2019-05-03 00:00:00 par 5-3, par exemple? J'ai essayé quelques boucles for mais en vain. Existe-t....
29 mai 2020 à 17:12
J'ai un tas de commandes très similaires qui ressemblent toutes à ceci (df signifie pandas dataframe): df1_part1=... df1_part2=... ... df1_part5=... df2_part1=... Je voudrais faire une boucle pour cela, comme suit: for i in range(1,5): for j in range(1,5): df%i_part%j=... Bien sûr, cela ne fonctio....
29 mai 2020 à 15:23
J'ai un dataframe (df) avec 2 colonnes principales - une appelée «TIMESTAMP» représentant les dates, et une appelée «QC» reflétant les drapeaux de contrôle de qualité comme des ints. Ce df a environ 40 000 lignes, donc je ne veux pas parcourir chacune d'elles. J'ai un nouveau dataframe (dfNew) avec ....
29 mai 2020 à 11:00
J'ai une trame de données qui ressemble à ceci: Date Value Value_Increase 1 2020-05-01 5 FALSE 2 2020-05-02 4 FALSE 3 2020-05-03 10 TRUE 4 2020-05-04 9 FALSE 5 2020-05-05 7 FALSE 6 2020-05-06 12 TRUE 7 2020-05-07 ....
29 mai 2020 à 01:10