应用 group_by 时保留 df 的所有变量并用日期汇总? [复制]

Posted

技术标签:

【中文标题】应用 group_by 时保留 df 的所有变量并用日期汇总? [复制]【英文标题】:Keep all variables of a df when applying group_by and summarise with date? [duplicate] 【发布时间】:2021-11-16 04:38:27 【问题描述】:

我只需要对同一个人进行重复人口普查的第一次调查, 所以我选择了这个人第一次接受采访,这很有效,但是我得到了一个没有初始 df 的所有其他变量的新对象。如何保留所有列?

df$var1 <- df%>%strptime(var1, "%Y-%m-%d")
survey_1 <- df%>% group_by(per)%>% summarise(var1 = min(var1))

【问题讨论】:

【参考方案1】:

summarize 更改为filter

df %>% group_by(per) %>% filter(var1 == min(var1))

【讨论】:

以上是关于应用 group_by 时保留 df 的所有变量并用日期汇总? [复制]的主要内容,如果未能解决你的问题,请参考以下文章

将group_by和count()应用到变量后计算总计的百分比

R使用dplyr group_by / sum for循环,作为连接列表输出

Group_by / 按函数内的两个变量汇总

python Group_by对象为df

Group_by,条件求和并替换R中的变量

在 R 中使用 aggregate/group_by 对数据进行分组并对每个因子变量进行计数?