J'ai un grand ensemble de données et je voudrais appliquer certaines transformations dans certaines variables par programme. Pour illustrer, disons que je veux appliquer le journal aux variables contenues dans un vecteur de caractères. Je voudrais conserver les variables d'entrée et générer une no....
8 mars 2021 à 23:47
Je pensais avoir la réponse à ma question ici, mais lorsque j'utilise avec mon plus grand ensemble de données, j'obtiens des résultats différents. Je soupçonne que la différence est due à la façon dont la ligne na.locf agit. Fondamentalement, je convertis le code où j'ai utilisé mutate_at en la no....
3 mars 2021 à 19:47
J'essaye de convertir le code de l'utilisation de mutate_at à l'utilisation de mutate(across()). Je suppose que j'ai une erreur de syntaxe, mais après 45 minutes à essayer de la comprendre, j'ai décidé qu'il était temps d'engager ce forum. Exemple reproductible: library(tidyverse) df_initial <- ....
3 mars 2021 à 05:10
Dans les versions précédentes de dplyr, si je voulais obtenir le nombre de lignes en plus d'autres valeurs récapitulatives en utilisant summarise(), je pourrais faire quelque chose comme library(tidyverse) df <- tibble( group = c("A", "A", "B", "B", "C"), value = c(1, 2, 3, 4, 5) ) df %>% ....
11 févr. 2021 à 22:38
Je suis nouveau sur dplyr et j'ai des difficultés à (i) comprendre sa syntaxe et (ii) transformer son ancien code de version en un code que je peux utiliser dans sa dernière version (dplyr 1.0.2). En particulier, je ne comprends pas les deux lignes de code suivantes: mutate_each(funs(replace(.,.=="....
4 févr. 2021 à 14:22
Supposons les données suivantes: df <- data.frame(x = c(1, 2), y = c(3, 4), z = c(5, 6)) Supposons en outre que j'ai un vecteur contenant les noms de colonnes sur lesquels je souhaite travailler, par exemple var_names_1 <- c("test", "x", "y") var_names_2 <- c("test....
3 févr. 2021 à 23:21
Supposons que j'ai un ensemble de données df dans lequel je veux faire correspondre la valeur de col X à travers les valeurs de plusieurs colonnes A to F et que je veux retourner le nom de colonne correspondant (sinon NA) dans une nouvelle colonne. Dput df <- structure(list(A = c(4L, NA, NA, NA), B ....
30 janv. 2021 à 13:02
set.seed(3) library(dplyr) x <- tibble(Measure = c("Height","Weight","Width","Length"), AD1_1= rpois(4,10), AD1_2= rpois(4,9), AD2_1= rpois(4,10), AD2_2= rpois(4,9), AD3_1= rpois(4,10), AD3_2= rpois(4,9)) Supposons que j'ai des données qui ressemblent....
22 janv. 2021 à 23:52
J'ai un dataframe comme le suivant mais plus grand: import pandas as pd data = {'First': ['First value','Third value','Second value','First value','Third value','Second value'], 'Second': ['the old man is here','the young girl is there', 'the old woman is here','the young boy is there','t....
21 janv. 2021 à 13:52
Disons que j'ai le data.frame suivant df: # col1 col2 col3 othercol1 othercol11 # 1 Bonjour WHAT_hello2 Bonjour 10 3 # 2 WHAT_hello WHAT_hello WHAT_hello .......
20 janv. 2021 à 17:23
J'ai un problème avec la fonction mutate (across ()). Dans le tibble que vous pouvez voir ci-dessous, je veux supprimer la "lettre + traits de soulignement" (par exemple "p__", "c__" etc) dans les colonnes. .......
18 janv. 2021 à 12:29
J'ai du mal à obtenir mutate, across et case_when pour fonctionner correctement, j'ai recréé une version simple de mon problème ici: a <- c(1:10) b <- c(2:11) c <- c(3:12) test <- tibble(a, b, c) # A tibble: 10 x 3 a b c <int> <int> <int> 1 1 2 3 2 2 3 4....
17 janv. 2021 à 03:32
J'ai des données dans le format décrit ci-dessous, où toutes les variables avec lesquelles je dois travailler sont NA ou le nom de la variable, et je dois changer les NA en 0 et les chaînes en 1. J'essaye .. .....
14 janv. 2021 à 04:00
J'essaie d'utiliser l'ensemble de données mtcars pour calculer des statistiques récapitulatives. Voici mon code - df% select (mpg, cyl, vs, am, gear, carb)%>% mutate (across (.......
11 janv. 2021 à 06:24
Dans un flux de travail dplyr, j'essaie de coller un 0 dans chaque colonne d'un dataframe après la colonne newvar lorsque newvar == 0, sinon ne faites rien. J'ai modifié le jeu de données iris: library (dplyr) n....
3 janv. 2021 à 13:59
J'ai 18 paires de variables et j'aimerais faire des calculs par paires pour calculer 18 nouvelles variables. La fonction across () de dplyr est très pratique lors de l'application d'une formule à une colonne. Existe-t-il un moyen d'appliquer across () à des paires de colonnes? Petit exemple avec u....
2 janv. 2021 à 23:08
J'ai des données similaires à celles-ci (bien qu'un ensemble de données beaucoup plus grand): correct.trial1 RT.trial1 correct.trial2 RT.trial2 correct.trial3 RT.trial3 1 1 473 0 337 1 426 2 1 496 1 407 ....
16 déc. 2020 à 01:31
Je souhaite avoir une fonction flexible utilisant summarize dans laquelle: la fonction d'agrégation est donnée par l'utilisateur la fonction d'agrégation peut utiliser d'autres arguments faisant référence à des variables dans les données elles-mêmes. Un bon exemple est l'utilisateur fournissant fun=....
11 nov. 2020 à 03:28
Je pense qu'il devrait y avoir un moyen très simple de le faire, mais je ne peux pas comprendre cela. Je veux utiliser across avec une liste de variables et des helpers tidyselect dans un grand ensemble de données, mais j'utiliserai iris comme exemple. Avant la mise à jour de dplyr 1.0, je pouvais u....
10 nov. 2020 à 06:00
Je suis sûr que la solution est une ligne unique, mais je me cogne la tête contre le mur. Voir le très court reprex à la fin du message; comment dire à dplyr que je ne veux doubler que les colonnes sans NA? Merci beaucoup library(dplyr) #> #> Attaching package: 'dplyr' #> The following objects ar....
27 oct. 2020 à 16:20
Un résumé de mon objectif J'ai la structure de dataframe suivante: my.df <-data.frame("col1_A.C"=c("AA","AC","CC"), "col2_A.T"=c("TT","AT","TT"), "col3_C.G"=c("GG","CG","CG")) my.df # col1_A.C col2_A.T col1_C.G # 1 AA TT GG # 2 AC ....
21 oct. 2020 à 08:00
Hé, j'essaye de renommer certaines colonnes en ajoutant "Last" avec la nouvelle version de dplyr mais j'obtiens toujours cette erreur Error: `across()` must only be used inside dplyr verbs. C'est mon code data %>% rename(across(everything(), ~paste0("Last_", .))) Version de dplyr: v1.0.2....
3 oct. 2020 à 23:26
Existe-t-il un moyen de muter toutes les variables numériques sauf une (dans ce cas, l'âge) ou deux? Les données data = data.frame( Year = c(1,2,5,7,2,6,2,6), days = c(5,3,6,3,7,2,5,7), age = c(1,3,5,23,2,4,5,2), names = c("A063", "A013", "A063", "A083", "A019", "A012", "A013", "A113....
9 sept. 2020 à 00:24
Dans mon bloc de données, je souhaite remplacer toutes les valeurs de certaines colonnes par NA. Test2 ID Sex Location Obs1 Obs4 Obs5 1 291978 FEMALE 2 16.5 4836 0.563636364 2 292429 FEMALE 2 20.2 5428 0.584158416 3 292466 FEMALE 2 19.2 48 0.005208333 4 29....
24 août 2020 à 15:23
Je m'excuse pour la longue question, mais après un certain temps, je n'ai pas pu trouver de solution moi-même. J'ai ce fichier de données de jouet set.seed(23) df <- tibble::tibble( id = paste0("00", 1:6), cond = c(1, 1, 2, 2, 3, 3), A_1 = sample(0:9, 6, replace = TRUE), A_2 = sample(0:9, 6, r....
24 juin 2020 à 16:43