dplyr

Posted 0820ll

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了dplyr相关的知识,希望对你有一定的参考价值。

dplyr包可用于处理 R 内部或者外部的结构化数据,相较于plyr包,dplyr包专注接受 data.frame 对象,大幅提高了速度,并且提供了更稳健的数据库接口。同时,dplyr包可用于操作Spark的dataframe。

安装dplyr包

install.packages("dplyr")

使用dplyr包

library("dplyr")

dplyr包中的重要函数

-- 根据值选择记录   filter()

-- 对行重新排序  arrange()

-- 根据名字选择变量  select()

-- 根据已知的变量创建新的变量  mutate()

-- 将许多值塌缩为单个描述性汇总  summarize()

-- 分组 group_by()   这些函数都可以通过 group_by() 衔接起来,该函数改变上述每个函数的作用域,从操作整个数据集到按组与组进行操作。

以上是关于dplyr的主要内容,如果未能解决你的问题,请参考以下文章

你能让 dplyr::mutate 和 dplyr::lag 默认 = 自己的输入值吗?

总结但保持长度可变(dplyr)

R语言dplyr包使用dplyr函数使用group_by函数summarise函数和mutate函数计算分组占比实战

带有`dplyr::count()`的标准评估[重复]

R取子集(dplyr方法)

R语言使用dplyr将特定的数据列移动到最前面使用dplyr将特定数据列移动到另一指定数据列的后面使用dplyr将特定数据列移动到另一指定数据列的前面