Utilisez cette balise pour les questions relatives aux fonctions du package dplyr, telles que group_by, résumer, filtrer et sélectionner.

Plus à propos dplyr...

Je suis novice en R et j'ai une question simple. J'ai un dataframe où j'ai une colonne sur l'horodatage et diverses autres fonctionnalités. La colonne d'horodatage est de 31 jours et je dois obtenir les n derniers jours (disons 16) de l'horodatage. En supposant 31 jours, il me donnera ensuite les ob....
9 déc. 2020 à 16:05
J'essaie de trouver des observations dans une colonne qui ont certaines ou toutes les valeurs possibles dans une autre colonne. Dans ce tibble parties <- tibble(class = c("R","R","R","R","R","K","K","K","K","K","K", "L","L","L","L"), name = c("Party1", "Party2","Party3","Party....
9 déc. 2020 à 14:49
Je voudrais résumer les lignes de Col1 pour lesquelles le Col2 est égal à 0. Et ajouter la somme à la première valeur après les zéros. Je montre un exemple ci-dessous. J'ai différents produits dans la base de données. Date <- seq(as.Date("2021-01-01"), as.Date("2021-01-07"), by = "day") Product<-re....
9 déc. 2020 à 14:11
J'ai une trame de données: ID <- c("a","a","a","a","d","d","d") rank <- c(2,3,4,5,1,2,3) view <- c(1,0,1,1,1,0,1) utility <- c(-3,3,-5,3,-6,-3,-15) temp <- data.frame(ID,rank,view,utility) Dans chaque groupe (ID), il y a une variable (vue), qui est booléenne. Pour chaque groupe, plusieurs lignes p....
9 déc. 2020 à 04:04
Je n'ai pas pu trouver un bon exemple d'utilisation de across / c_across avec la syntaxe de sélection tidy pour sélectionner des variables contenant plusieurs chaînes. Je trouve que str_detect fonctionne bien, mais il ne semble pas fonctionner dans les verbes dplyr? La première ligne de résumé fonct....
9 déc. 2020 à 03:09
Travailler avec des données de suivi qui suivent la position XY d'un objet. Exemple reproductible de mes données: trial <- c(rep(1, 25), rep(2, 25), rep(3, 25)) timemini <- c(1:25) time <- c(rep(timemini, 3)) Y <- c(NA, NA, 3:10, NA, NA, NA, NA, NA, 16:25, NA, NA, NA, 48:55, NA, NA, NA, NA, NA, NA, ....
8 déc. 2020 à 00:42
Je veux utiliser la commande filter de dplyr avec str_detect. library(tidyverse) dt1 <- tibble( No = c(1, 2, 3, 4) , Text = c("I have a pen.", "I have a book.", "I have a pencile.", "I have a pen and a book.") ) dt1 # A tibble: 4 x 2 No Text <dbl> <chr....
7 déc. 2020 à 16:11
J'ai un ensemble de données d'enquête qui utilise des réponses à l'échelle de Likert, codées de 1 à 5 («pas du tout d'accord» à «tout à fait d'accord»). J'essaie de recentrer les scores autour de 0, de sorte que -2 signifie «fortement en désaccord» et +2 est «fortement d'accord». Un moyen évident po....
7 déc. 2020 à 16:06
Voici un jeu de données sur les jouets. data = crossing(q = letters[1:4], nums = c(1:100)) set.seed(25) data$val = sample(as.factor(c("x","y", "z")), nrow(data), prob = c(0.5,0.2,0.3), replace = T) data = data %>% pivot_wider(names_from = q, values_from = val) %>% select(-nums) a b c ....
7 déc. 2020 à 15:59
J'ai une trame de données dans R qui a deux colonnes comme indiqué ci-dessous. Il a une colonne de la date de création de la tour dans une ville. Les données représentent le jour où une tour a été installée dans une ville. par exemple. le 1er avril, dans ces quelques villes, une tour a été installée....
7 déc. 2020 à 15:49
J'ai la trame de données suivante: df <- structure(list(s_do_h_patients_state = c("NC", "NC", NA, NA, "MN", "MN", "UT", "UT", "IL", "IL"), diabetes = c(FALSE, TRUE, FALSE, TRUE, FALSE, TRUE, FALSE, TRUE, FALSE, TRUE), n = c(24191L, 5684L, 24386L, 3820L, 18768L, 2423L, 19732L, 1313L, 15670L, 2336L....
7 déc. 2020 à 14:08
J'ai ces ensembles de données set.seed(1) df1<- data.frame( user = as.factor(rep(c("mike","john","david", "gabriel"), each =4)), trx_date = sample(seq(as.Date('1999/01/01'), as.Date('2000/01/01'), by="day"), 16) ) df2<- data.frame( user = as.factor(c("mike","john","david")), filter_date= as....
7 déc. 2020 à 13:24
J'ai cette base de données de lectures de diverses variables pour certaines espèces. il y a 6 lectures par variable pour chaque espèce. Je veux résumer les données par espèce et avoir chaque cellule montrant la moyenne ± SEM (ou SD). voici les 10 premières lignes des données specie x.col otu ....
7 déc. 2020 à 11:45
J'ai les données suivantes pt_id <- c(1,1,1,1,1,2,2,2,3,3,3,3,3,4,4,4,4) Tobacco <- c("once","twice","never", NA, NA, NA, NA, NA,"Once","Twice","Quit","Once",NA,NA,"Never", NA, "Never") Alcohol <- c("twice", "once",NA, NA, "never", NA, NA, "Once", NA, "Quit", "Twice", NA, "Once", NA, NA, "Never", "N....
7 déc. 2020 à 10:49
Je voudrais créer une nouvelle table de données qui est la somme sur les lignes de variables qui contiennent une chaîne. J'ai essayé de garder cela dans le tidyverse en tant que noob en utilisant le nouveau dplyr across. Aide très appréciée. dat<- data.frame("Image" = c(1,2,3,4), "....
7 déc. 2020 à 07:19
J'ai deux blocs de données distincts et ce que j'essaie de faire, c'est que pour chaque année , je souhaite vérifier le bloc de données 2 (la même année) et multiplier une colonne de la bloc de données 1 par le résultat nombre. Par exemple, imaginez que ma première trame de données soit: year <- c(....
6 déc. 2020 à 23:56
Mon objectif est de connaître la demi-vie (à partir de la phase terminale si quelqu'un est familier avec la pharmacocinétique) J'ai quelques données contenant ce qui suit; 1500 lignes, ID étant la "clé" principale. Il y a 15 lignes par ID. Ensuite, j'ai d'autres colonnes TIME et CONCENTRATION. Maint....
6 déc. 2020 à 17:28
J'ai trois blocs de données avec des recettes différentes que j'ai obtenues sur un site Web. Le premier est pour les crêpes; le second est pour le pain grillé français; le troisième est pour les œufs bénédictins. Ensuite, je combine ces trois tables en une seule table que j'appelle recettes_list. # ....
6 déc. 2020 à 07:53
J'essaie de comprendre la syntaxe de travail avec dplyr et je rencontre des problèmes pour transmettre plus d'une colonne à une autre fonction (par exemple str_detect). Je veux rechercher dans un tibble et sélectionner toutes les lignes où une certaine chaîne est détectée. Je peux l'exécuter pour un....
5 déc. 2020 à 17:02
J'ai besoin d'agréger deux séquences POSIXct de 5 min en séquences de 10 min. Pour ce faire, je souhaite créer une clé de 10 min à partir des deux séquences de 5 min de sorte que les deux utilisent les mêmes niveaux. Je me demande s'il existe un moyen R de faire cela? Voici un exemple: a = seq(as.PO....
5 déc. 2020 à 12:36
Je voudrais transformer cette trame de données: y<- c("1","2","2","3") n<- c("co","ny","tn","ri") data <- data.frame(y,n) Dans cette trame de données y <- c(1,1,2,2,3) n <- c("co","co","ny","tn","ri") n2 <- c("ny","tn","ri","ri",NA) data <- data.frame(y,n,n2) Je pensais à quelque chose dans le s....
J'ai 5000 lignes de jusqu'à 2000 valeurs séparées par ";" qui sont actuellement stockés dans une seule colonne. Je voudrais les séparer, les ajouter et jeter la colonne d'origine. Problème: je maximise rapidement la mémoire. Utilisant actuellement plus de 60 Go de RAM. Quelle est la bonne façon de g....
5 déc. 2020 à 01:20
Cela peut sembler une question un peu basique, mais après avoir examiné la documentation et effectué des recherches sur Internet, je n'ai pas trouvé de réponse à cela. Ma question est la suivante: est-ce que R dplyr inclut un argument pour générer automatiquement une colonne avec des résultats de fu....
4 déc. 2020 à 21:58
Je voudrais calculer la proportion d'apparitions de valeur == 1 à la somme des nombres d'apparitions par classe de groupe. Exemples de données: value class 0 urban 0 urban 1 forest 0 forest 0 lake 1 sea 1 sea 0 sea Résultat attendu: proport....
4 déc. 2020 à 20:52
J'ai ce message d'avertissement lorsque j'utilise ce script Je pense que je dois utiliser une liste au lieu de funs ()? library(dplyr) result <- iris %>% count(Species) %>% bind_rows(summarise_all(., funs(if(is.numeric(.)) sum(.) else "Total"))) Message d'alerte: funs() est obsolète à parti....
4 déc. 2020 à 19:10