Un bloc de données est une structure de données tabulaire. Habituellement, il contient des données où les lignes sont des observations et les colonnes sont des variables de différents types. Alors que "data frame" ou "dataframe" est le terme utilisé pour ce concept dans plusieurs langues (R, Apache Spark, deedle, Maple, la bibliothèque pandas en Python et la bibliothèque DataFrames en Julia), "table" est le terme utilisé dans MATLAB et SQL.

dataframe...

J'ai des données: test_df <- data.frame(x1 = c("a", "b", "c", NA, NA), x2 = sample(1:5), x3 = c(T, NA, F, T, NA), x4 = c(NA, NA, 1, 2, 3), stringsAsFactors = F) colset1 <- c("x1", "x2", "x3") colset2 <- c("x2",....
17 juin 2020 à 12:07
J'ai une trame de données ressemblant à ceci: df <- data.frame(Name = c("BB", "AA", "AA", "BB", "DD", "AA", "DD", "DD", "CC"), string = c("a11", "a120", "a120", "a8", "a45", "a11", "a140", "a8", "a45") , value = rnorm(9, mean = 0, 1)) Name string value BB a11 0.5....
17 juin 2020 à 02:31
Toutes mes excuses pour le titre (potentiellement) médiocre, mais j'ai du mal à comprendre comment le décrire moi-même. J'ai un ensemble de données qui, lorsqu'il est lu dans un dataframe pandas, a à peu près la forme suivante: import pandas as pd import numpy as np df_all = pd.DataFrame(np.random.....
17 juin 2020 à 00:05
Mes données d'exemple sont: a <- data.frame(a1=c('a','b','c','d','e'), a2=c('b','a','d','c','f'), a3=c(0.1,0.3,0.5,0.1,1)) Ce que je veux faire, c'est combiner les colonnes a1 et a2 et trier les chaînes en même temps. Ainsi, les données devraient changer pour: a1 a....
16 juin 2020 à 10:38
Tout comme le titre l'indique, j'essaie de convertir mes étiquettes DataFrame en type datetime. Dans la tentative de solution suivante, j'ai extrait les étiquettes de DataFrame en dates_index et j'ai essayé de les convertir en datetime en utilisant la fonction DatetimeIndex.to_datetime, cependant, m....
13 juin 2020 à 06:39
Df.head (10) XYZVal 0 {"X":"56.68","Y":"51.56","Z":"100"} 1 {"X":"58.05","Y":"52.37","Z":"62.6"} 2 {"X":"59.32","Y":"54.48","Z":"69.59"} 3 {"X":"58.51","Y":"36.36","Z":"82.76"} 4 {"X":"65.21","Y":"60.26","Z":"71.06"} 5 {"X":"57.64","Y":"52.07","Z":"67.89"} 6 {"X":"58.24","Y":"50","....
12 juin 2020 à 22:15
J'ai une trame de données qui ressemble à: name date value 0 a 2020-01-01 1 1 a 2020-01-03 1 2 a 2020-01-05 1 3 b 2020-01-02 1 4 b 2020-01-03 1 5 b 2020-01-04 1 6 b 2020-01-05 1 Où les valeurs ont été calculées par value_df = df.....
12 juin 2020 à 17:14
J'ai un pandas DataFrame comme celui-ci: year = [2015, 2016, 2009, 2000, 1998, 2017, 1980, 2016, 2015, 2015] mode = ["automatic", "automatic", "manual", "manual", np.nan,'automatic', np.nan, 'automatic', np.nan, np.nan] X = pd.DataFrame({'year': year, 'mode': mode}) print(X) year mode 0 ....
12 juin 2020 à 16:44
J'ai 2 DataFrames et j'essaie de trouver le meilleur moyen d'itérer sur chaque ligne de df_a et de voir si l'une des valeurs est différente de la ligne correspondante dans df_b. Si même une seule valeur est différente, j'aimerais considérer les lignes comme différentes. Exemple: Df_a df_a = pd.DataF....
12 juin 2020 à 08:58
J'ai un dataframe comme ci-dessous Saisie Date Country Type Zip_Incl Zip_Excl 10/4/2020 FR Regional 57_67_68 2/1/2020 GB Regional AB_DD 17/3/2021 GB Regional BT_TY TS_TN 18/3/2021 GB Regional ....
12 juin 2020 à 06:54
J'ai un dataframe avec 2 colonnes qui sont remplies d'horodatages avec leurs valeurs correspondantes. Le df contient environ 7000 lignes (données sur 2 mois) et je voulais les diviser en cadres de données plus petits pour chaque semaine. Je peux bien sûr les diviser en jours, etc. mais je ne connais....
12 juin 2020 à 00:37
Supposons que j'ai ce dataframe df <- data.frame(keep = c(1, NA, 2), also_want = c(NA, NA, NA), maybe = c(1, 2, NA), maybe_2 = c(NA, NA, NA)) Modifier: Dans le cadre de données réel, il y a de nombreuses colonnes que je voudrais conserver, ....
11 juin 2020 à 15:47
J'ai un dataframe python avec une colonne appelée codes d'erreur: df1=pd.DataFrame({'errorcodes1':[6321,235,314,421,5346,514,4,3415,136,216,34,623]) J'ai besoin d'une fonction qui produit: [6,2,3,4,5,5,4,3,1,2,3,6]. J'ai pensé à convertir chaque code d'erreur en une chaîne et à extraire l'élément [....
11 juin 2020 à 15:38
J'ai un dataframe pandas qui a quatre colonnes. Voici un exemple du dataframe pandas: import pandas as pd data = {"Name" : ['A1', 'A1', 'A1', 'A1'], "String1" : ["B1", "B2", "B6", "B7"] , "Values1" : [5, 12, 21, 99], "Values2" : [50, 120, 210, 990] } df = pd.DataFrame(data) print( df ) Name....
11 juin 2020 à 11:25
Je lis des données dans une trame de données à partir d'une feuille Excel. Cela ressemble à quelque chose comme ceci: ColumnA 0: abc-123 1: xyz-456 Je veux l'avoir comme ça où il prend tout avant le tiret de A et crée une nouvelle colonne B: ColumnA ColumnB 0: abc-123 abc 1: xyz-456 xyz J'....
11 juin 2020 à 00:30
J'ai une liste de protéines comme celle donnée dans df1 df1 <- data.frame( names = c("Gen1", "Gen2", "Gen3")) Je dois changer ces noms en leur identifiant à l'aide d'une table de protéines, la façon dont ils sont liés est résumée dans df2 df2 <- data.frame( Protein.name = c("Gen1", "Gen2", "G....
10 juin 2020 à 20:46
Je travaille avec les df suivants et j'ai un blocage mental avec mon problème, mon idée est de supprimer un groupe de lignes en tenant compte des critères. Si une observation dans rrp_nsw, rrp_qld, rrp_sa, rrp_tas ou rrp_vic est négative, je souhaite supprimer toutes les lignes qui partagent les mêm....
10 juin 2020 à 20:22
Je suis nouveau sur les pandas et je veux être en mesure d'obtenir le nombre d'instances pour chaque personne et de le nourrir dans un autre Dataframe en tant que colonne. J'ai supprimé les valeurs NaN du dataframe avant de créer le groupe par la colonne utilisateur J'ai essayé mais cela ne semble p....
10 juin 2020 à 18:17
Voici un ensemble de données que j'essaie de sous-ensemble: df<-data.frame( id=c(1:5), ax1=c(5,3,7,-1,9), bx1=c(0,1,-1,0,3), cx1=c(2,1,5,-1,5), dx1=c(3,7,2,1,8)) L'ensemble de données a une variable x1 qui est mesurée à différents moments, désignés par ax1, bx1, cx1 et dx1. J'essaie de sous-ensembl....
10 juin 2020 à 09:57
Obtenu le code suivant import pandas as pd import numpy as np df1=pd.read_excel('FA9th june.xlsx') df1.head() Days Amount Repayments Balance 40.0 19 500.00 15 000.00 4 500.00 40.0 19 500.00 0 19 500.00 40.0 9 750.00 2 670.00 7 080.00 40.0 32 500.00 11 500....
9 juin 2020 à 22:14
Je cherche à créer un nouveau dataframe à partir de données dans deux dataframes séparés - correspondant efficacement à l'index de chaque cellule et à l'entrée dans un dataframe à deux colonnes. Mes ensembles de données réels ont exactement le même nombre de lignes et de colonnes, FWIW. Exemple ci-d....
9 juin 2020 à 21:21
J'ai deux dataframe (df1 et df2), j'essaie de comprendre comment utiliser les conditions de df2 pour extraire les valeurs de df1 et utiliser les valeurs extraites dans df2. Df1 = valeurs à extraire de Df2 = conditions d'exaction et df où les valeurs extraites sont utilisées Conditions: df2.HJ = df1H....
9 juin 2020 à 19:23
J'espère que vous pourrez m'aider avec ce problème, J'ai ces données ci-dessous (noms de colonnes peu importe) data=([['file0090', ([[ 84, 55, 189], [248, 100, 18], [ 68, 115, 88]])], ['file6565', ([[ 86, 58, 189], [24, 10, 118], [ 68, 11, 8]]) ]]) Je dois parcourir ....
9 juin 2020 à 16:53
J'ai besoin de votre aide dans l'un de mes R-Scripts. J'ai un df qui ressemble à ceci: X1 X2 X3 1 123 NA 2 125 125 3 210 NA 4 NA 212 5 214 213 6 NA 225 Je dois en quelque sorte fusionner X2 et X3 pour que chaque "NA" dans X2 soit sous-défini avec la valeur de X3 Le df devrait alors ressem....
9 juin 2020 à 15:55
En utilisant python / pandas, j'essaie de réduire les lignes de dataframe à un tableau qui contient les noms de colonne de la dataframe d'origine, si l'entrée d'origine est True. (Pdb) df = pd.DataFrame(np.array([[True,False], [True,True], [False,True]]),columns=['x','y']) (Pdb) df x y 0....
9 juin 2020 à 14:21