Un bloc de données est une structure de données tabulaire. Habituellement, il contient des données où les lignes sont des observations et les colonnes sont des variables de différents types. Alors que "data frame" ou "dataframe" est le terme utilisé pour ce concept dans plusieurs langues (R, Apache Spark, deedle, Maple, la bibliothèque pandas en Python et la bibliothèque DataFrames en Julia), "table" est le terme utilisé dans MATLAB et SQL.

Plus à propos dataframe...

Je souhaite diviser les données suivantes en deux colonnes, latitude et longitude et mettez-les dans un fichier de données. 0 (45.349586099999996, -75.81031967988278) 1 (-37.77922725, 175.2010323246593) 2 (-42.9945669, 170.7100413) 3 (-39.2711067, ....
J'aimerais utiliser la méthode .Query .Query pour filtrer une colonne dans un fichier de données par une variable mais elle ne fonctionnera pas avec une variable, seule une chaîne. Quelqu'un sait comment le faire fonctionner avec une variable? Merci. import pandas as pd var="A" source = {'COL1'....
3 juin 2021 à 01:40
J'ai un Dataframe lexdata et je veux vérifier et compter le nombre de valeurs nulles et détecter également des valeurs non valides dans la colonne de vente "certaines des colonnes Exemples de données city year month sales 0 Abilene 2000 1 72.0 1 Abilene 2000 2 ....
3 juin 2021 à 00:00
J'ai un fichier Excel et j'ai créé des listes de ses colonnes. Le problème est que les rangées des colonnes ne sont pas égales. Par conséquent, j'ai plusieurs valeurs «Nan» aux extrémités des listes. J'ai essayé de les supprimer de la méthode Drowna (), mais il y a toujours les valeurs «Nan». Voici ....
2 juin 2021 à 22:09
J'ai un Dataframe qui ressemble à ceci et je voudrais calculer le pourcentage de la colonne de colonne comparant à la colonne. Dans cet exemple dans colonnes, j'ai 3 valeurs identiques aux valeurs de la colonne columnA columnB 0 A None 1 H H <--- 2 A A ....
2 juin 2021 à 01:41
J'essaie de commander une table qui a 3 variables, communément appelée table à 3 voies. J'ai joint une image de la structure de la table que le code reproductible produira. Est-il possible de commander ce tableau de manière logique, malgré le fait qu'il est essentiellement divisé en trois sections ....
1 juin 2021 à 22:45
Je souhaite diviser une colonne en 4 classes distinctes et étiqueter chaque classe de 0,1,2,3 selon les 3 quantiles. This is my Dataframe 0 36.88 1 36.88 2 36.88 3 36.88 4 49.12 ... 695 80.88 696 30.98 697 31.22 698 31.22 699 31.76 Name: total_c....
1 juin 2021 à 20:49
Je veux la sortie suivante de My Pandas Dataframe DF: {1622564509268542720: '36.15', 1622564509311439360: '37.83', 1622564509312406784: '38.20', 1622564509357944832: '40.40', 1622564509358921984: '33.46', 1622564509404489472: '38.37', 1622564509405471232: '37.15'} Lorsque je tape df.head(3).to_dict....
1 juin 2021 à 20:06
Utilisez cela et même si cela devrait être simple, je n'ai trouvé que des solutions pour des cas complets ou la sélection de sous-ensembles de colonnes pour alors omettre leur NAS. Dans mon cas, j'ai un cadre de données comme celui-ci: vp01ob__0 vp01ob__1 vp01ob__2 vp01ob__3 vp01ob__4 vp01ob__5 v....
1 juin 2021 à 19:30
J'essaie actuellement de comparer les noms de colonne de deux cadres de données (ex. DF1 et DF2) et d'extraire les valeurs de l'une d'elles (DF2), s'il existe une correspondance, pour créer un nouveau (troisième) cadre de données. Exemple, df1 <- data.frame(x3=469, x4=465, x7=501, x10=467, x12=459) ....
1 juin 2021 à 17:05
J'ai les données suivantes !pip install yfinance import yfinance as yf import numpy as np import pandas as pd from pandas_datareader import data df=yf.download('BTC-USD',start='2017-01-01',end='2021-05-31',interval='1d') #I calculated simple moving average as follow df['SlowSMA']=df['Close'].ew....
1 juin 2021 à 16:17
Je travaille sur un projet de travail dans la fabrication dans laquelle toutes les pièces pour chaque article commandé ont un code unique à 6 chiffres; Il y a 68000 enregistrements. Tous les codes de pièce sont placés dans une seule colonne, dans une seule chaîne, en tant que telle avec chaque chaîn....
1 juin 2021 à 14:46
Disons que j'ai une trame de données: index day 0 21 1 2 2 7 Et à chaque jour, je veux attribuer 3 valeurs: 0,1,2 à la fin, le Dataframe devrait ressembler à ceci: index day value 0 21 0 1 21 1 2 21 2 3 2 0 4 ....
1 juin 2021 à 14:42
J'ai deux dataframes. month_data Dataframe a des jours du début du mois jusqu'à la fin. student_df avec les seules données present de chaque élève. J'essaie de cartographier les deux dataframes afin que les jours restants laissés pour chaque élève soit marqué comme absent Mois_data day_of_mo....
1 juin 2021 à 14:08
J'ai utilisé cette méthode pour attribuer des caractéristiques à leurs numéros respectifs dans un fichier de données: usagers = usagers.replace({'actp':{-1:'Non renseigné', 0:'Non renseigné ou sans objet', 1:'Sens véhicule heurtant', 2:'Sens inverse du véhicule', 3:'Traversant', 4:'Masqué', 5:'Jouan....
1 juin 2021 à 13:35
Les pandas obtiennent des journées dans une colonne de la date de début? Start_date = '01 / 01/2021 '(jj / mm / aaaa) Df dates 2021-01-01 2021-01-02 . . . 2021-02-01 . . . 2021-06-01 (end date should be current date) ....
1 juin 2021 à 13:27
J'ai un dictionnaire de tableaux numpopiques de taille égale, que je souhaite entrer dans un fichier de données, où chaque des valeurs dans les matrices NUMPY devient une colonne. Par example: import numpy as np import pandas as np my_dict = { "key_1": np.arange((50_000)), "key_2": np.arang....
1 juin 2021 à 13:06
Il y a donc cm_satisfaction colonne contenant différentes valeurs telles que complètement insatisfaites, quelque peu satisfaites et entièrement satisfaites dans les pandas. J'ai besoin du nombre d'électeurs où entièrement_satisfait. J'ai découvert que d'utiliser Fully_Satisfied=survey[survey["CM_sat....
1 juin 2021 à 12:47
Entrées J'ai un Dataframe avec plusieurs colonnes. proof_path = #1 X Y #2 X_ Z #3 W Z_ #4 W_ Y_ 0 p1 a b p2 a c p2 a c p3 a b 1 p1 a b p2 a c p3 a c p1 a b 2 p1 a b p2 a d p3 e d p4 e b Dans le système de données ci-dessus, je souhaite examiner si c....
1 juin 2021 à 12:08
J'ai ce genre de cadre de données dans R x y name1 value x name1 value y name2 value x name2 value y name3 value x name3 value y Je veux le convertir de cette façon x y z name1 value x value y name2 value x value y name3 value x value y J'ai essayé de r....
1 juin 2021 à 11:49
Mon df: items $ shop_id 10CLV pen red 5.12 10CLV pencil red 6.41 10PLB pen red 7.30 10PLB pencil red 9.53 Comment créer un nouveau Dataframe, où sera une colonne en tant que soustraction de deux éléments (seulement deux d'entre eux dans chaque shop_id) par ch....
1 juin 2021 à 10:14
J'essaie de commander les colonnes dans une table à double sens que j'ai créée en fonction des valeurs de ligne. J'ai sauvegardé la table à double sens comme une table, la mettant ainsi dans un Dataframe (j'utilise R). Le code ci-dessous doit créer une table à double sens en fonction des données IRI....
1 juin 2021 à 09:30
Entrées J'ai ces deux dataframes current_rComp = #1 X Y 0 p1 A B next_rComp = #2 X Z 0 p2 A C 1 p3 A D Je dois rejoindre Inner Join 2 Dataframes avec la même clé (X) et restaurer la colonne Drophed {x1}} de next_rComp. J'ai donc essayé comme ci-dessous. key = current_rComp.c....
1 juin 2021 à 08:58
J'ai des résultats d'un perm.t.test que je voudrais transformer en cadre de données. J'ai beaucoup essayé et cherché beaucoup mais je ne parviens pas à résoudre ce problème, je suis toujours nouveau à R. Ceci est une version réduite de mon ensemble de données: treat = c("C","C","C","C","C","C","C","....
1 juin 2021 à 08:04
J'ai un dataframe avec une colonne qui commence au hasard un "comptage" à 1. Mon objectif est de produire un nouveau_col qui divise ma colonne actuelle par la dernière valeur dans un compte. Voir ci-dessous pour un exemple. C'est mon Dataframe actuel: col 0 1.0 1 2.0 2 3.0 3 1.0 4 2.0 ....
1 juin 2021 à 07:53