Вопросы, помеченные тегом «dplyr»

Используйте этот тег для вопросов, касающихся функций из пакета dplyr, таких как group_by, summarize, filter и select.
avatar
lost
9 августа 2021 в 05:06
70
0

передать строку таблицы именованной функции в виде именованных векторов, не перечисленных в списке, включая столбцы списка

Я хотел бы передать однострочный блок/кадр данных foo_tibble в foo_func и чтобы каждый столбец foo_tibble, включая столбцы списка, был незарегистрированным вектором при ссылке внутри foo_func по имени столбца. Ближайшее, что я получил, это...
avatar
zher4883
9 августа 2021 в 02:15
42
1

R: Как изменить столбец и сгруппировать его

Я не совсем уверен, как описать свою проблему, но я хотел бы провести анализ временных рядов данных о COVID-19. Ниже мой код library(dplyr) hospital=read.csv("https://raw.githubusercontent.com/MoH-Malaysia/covid19-...
avatar
logjammin
8 августа 2021 в 21:55
42
1

В R условное левое соединение двух таблиц в зависимости от значения индикаторной переменной в левой таблице

Фон У меня есть два фрейма данных о бейсбольных карточках и их рыночной стоимости. Эта информация взята из «Альманаха бейсбольных карточек», справочников по стоимости карт, публикуемых каждый год. Первая, d, представляет собой таблицу с card_id каждой карты, а также...
avatar
PraveenKumar
8 августа 2021 в 20:46
86
2

Как удалить строки, если два условия репликации имеют ноль?

У меня есть такие данные, как два условия (условие 1, условие 2) и каждое условие с шестью повторениями. Я хотел бы отказаться, если три из двух реплик условия 1 имеют ноль в строке (выборка/строка). gene_name con1_1 con1_2 con1_3 con2_1 con2_2 con2_3 YLZC_aa4043...
avatar
island1996
8 августа 2021 в 20:26
38
2

(в R) как расположить столбец A на основе столбца B

Я получил вот такой фрейм данных: Завод Хлеб А а А а Б с Б б В д С а Д е Я хочу найти название фабрики с наибольшим количеством хлеба Я написал два кода и получил разные ответы. 1. df %>% group_by(factory, bread)%>% summarise(n =...
avatar
Charalampos Spanias
8 августа 2021 в 19:23
40
1

Цикл For для заполнения определенных ячеек во фрейме данных (большой набор данных)

версия R версия 4.0.5 (31 марта 2021 г.) ОС Windows 10 x64 система x86_64, mingw32 Пользовательский интерфейс RStudio язык (EN) сопоставить English_United Kingdom.1252 ctype English_United Kingdom.1252 tz Европа/Лондон Дата 2021-08-08 Всем привет, Я пытаюсь вычислить...
avatar
island1996
8 августа 2021 в 17:22
67
3

Результат фильтрации на основе разных условий для разных столбцов

Я хочу найти человека с самым низким средним баллом при соблюдении следующих критериев: Всего более 2 отзывов Более 3 просмотренных объектов Люди оценка элемент Мэри 1.0 а Мэри 2.0 а Джек 1,5 b Джек 3.0 а Джек 4.1 b Кейт 0,8 а Я написал такой...
avatar
user16597745
8 августа 2021 в 17:21
31
1

Как перекодировать категорию внутри переменной, используя условие другой переменной

У меня есть две переменные - Семейное положение (холост, женат, разведен) и Возраст (непрерывно). Семейное положение имеет много NA Я хочу перекодировать лиц с отсутствующим семейным положением (NA) и в возрасте <15 лет как одиноких в переменной «Семейное...
avatar
Danby
8 августа 2021 в 15:19
187
4

Разделите сумму каждого столбца на сумму матрицы

Если у меня есть кадр данных: d = data.frame(sample=c("a2","a3"),a=c(1,5),b=c(4,5),c=c(6,4)) d sample a b c 1 a2 1 4 6 2 a3 5 5 4 Как мне разделить сумму каждого столбца на сумму всего фрейма данных с помощью dplyr, чтобы я получил фрейм данных, который...
avatar
melil
8 августа 2021 в 12:43
224
1

Ошибка DPLYR: аргумент не интерпретируется как логический

I want to subset glioma samples as scf.glioma dataframe from the scf dataframe by removing any columns that begin with NB, which is saved as scf.control. Я попытался использовать функцию select в библиотеке dplyr, чтобы отфильтровать любые образцы scf.control из кадра...
avatar
island1996
8 августа 2021 в 12:43
114
1

как фильтровать фрейм данных с условиями многих столбцов

Обновить! после попытки кода в комментарии. результат показывает мне все brand_id, у которых review_score равен 5 (самый высокий балл). В то время как есть более тысячи brand_id по 10 отзывам... поэтому я все еще в замешательстве дело в том, что я получаю фрейм данных...
avatar
aorali
8 августа 2021 в 12:38
38
1

Начало и конец событий присваиваются месяцу начала в зависимости от условия

У меня есть данные для 2000 событий с датой начала и окончания каждого события и продолжительностью. Я пытаюсь найти частоту событий по месяцам и годам. Но некоторые из событий разделены на два последовательных месяца (скажем, май и июнь), и требуется, чтобы эти...
avatar
aorali
8 августа 2021 в 05:42
128
1

Создайте идентификаторы для каждого отдельного последовательного вхождения по группе

У меня есть эти данные, и я ищу способ назначить идентификаторы для каждого отдельного последовательного события на основе дат, когда каждая группа (город) имеет различную последовательность идентификаторов. Мне нужно создать два разных типа идентификаторов: ID1,...
avatar
bpg
8 августа 2021 в 00:05
96
2

Создать новую переменную на основе условия в нескольких столбцах

У меня есть бинарная переменная ("Наказание") и 30 факторов с одинаковыми уровнями: "Выписка", "Приостановлено", "Штраф", "Общественный заказ" и "Тюремное заключение". Небольшой...
avatar
logjammin
7 августа 2021 в 23:07
67
2

В R создайте переменную условного индикатора на основе (а) первого экземпляра типа записи и (б) разницы в датах.

Фон Вот df с некоторыми данными из крупного магазина только для членов, похожего на Costco: d <- data.frame(ID = c("a","a","b","c","c","d"), purchase_type = c("grocery","grocery",NA,"auto","grocery",NA), date_joined =...
avatar
Lcsballer1
7 августа 2021 в 16:15
114
1

Скользящее среднее, 1, 2 и 3 запаздывания статистики — R

Изображение моего набора данных ниже: Для каждой из переменных, начиная с HomeTeam и выше, я хочу получить полное скользящее среднее с запаздыванием, 1 запись среднего значения с запаздыванием, 2 записи среднего с запаздыванием и 3 записи с запаздыванием среднего для...
avatar
aorali
7 августа 2021 в 15:49
110
2

Запуск кодов R по группам

У меня есть следующий код для поиска дней, когда максимальная температура и температура > соответствующих 90-х процентилей. Код отлично работает, когда у меня есть фрейм данных для одной станции (df). #data for one station df Date tmax tmin max90p min90p ...
avatar
Statistican
7 августа 2021 в 15:05
490
3

Поиск по нескольким столбцам с помощью регулярного выражения и извлечение совпадения

У меня есть следующая структура данных, и я хочу проверить наличие определенной строки ('^881') в столбцах с var1 по var4. И записать результат совпадения в новую колонку (RESULT), либо пустой результат, если строка не найдена. var1 var2 var3 var4 ОЖИДАЕМЫЙ...
avatar
zizamuft
7 августа 2021 в 01:34
96
1

как преобразовать все <NotAvailable> в <NA> [дубликат]

У меня есть этот df PoolQC Fence MiscFeature <chr> <chr> <chhr> <NOT AVAILABLE> <NOT AVAILABLE> <NOT AVAILABLE> <NOT AVAILABLE> <NOT AVAILABLE> <NOT AVAILABLE> ...
avatar
Yonghao
7 августа 2021 в 00:37
77
0

fuzzyjoin на основе относительной разницы

Я понял, что fuzzyjoin::difference объединит две таблицы на основе абсолютной разницы между столбцами. Есть ли функция R, которая будет объединять таблицы на основе относительных/процентных различий? Я мог бы сделать это, используя full_join() + filter(), но...