R语言基础知识|dplyr管道函数处理表格
Posted 菜鸟学数据分析之R语言
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了R语言基础知识|dplyr管道函数处理表格相关的知识,希望对你有一定的参考价值。
01
select()变形函数
dplyr包的安装就不展示了,dplyr包是内含多函数且功能强大的数据处理包。
#导入表格数据给data
data<-read_excel("~/Desktop/Excel学习/表姐牌口罩销售数据.xlsx")
data
select(data, "销售城市", "产品类别", "销售员", "金额")
02
filter( )
filter( ) 函数 筛选数据框内容,选择产品类型是纯棉口罩的数据。
多条件筛选,只要在filter中多增加筛选条件即可
03
mutate( )
mutate( )函数用来创建新的数据框,创建新的1列为销售额。
04
arrange( )
arrange( ) 函数可用于创建一个新的数据框,这个数据框可以按照1个或多个变量进行排序。
desc( ) 函数表示降序排列。让上述表格按照金额和单价进行降序排列。
05
group_by( )+summarize()
group_by( ) 这个函数是用来创建分组的。summarize()用来汇总数据,汇总产品类别和销售城市,同时增加平均数量和均价。
06
%>%管道操作符
%>%管道操作符,这个是我在dplyr包中最喜欢的一个操作符了,它运用起来特别方便,能够连接前后两个步骤,实现嵌套使用简化代码的同时还能避免存储多余的中间值而节省内存空间。它的作用是把符号左侧返回的结果,作为符号右侧调用函数的第1个参数。实际上,x %>% f(...)相当于于f(x, ...)。
往期推荐阅读
我知道你 在看 哦
以上是关于R语言基础知识|dplyr管道函数处理表格的主要内容,如果未能解决你的问题,请参考以下文章
R语言dplyr包coalesce函数处理缺失值(missing value)实战
R语言dplyr包mutate_all函数一次性处理所有的数据列的内容(使用统一的函数)实战
R语言dplyr处理dataframe:使用mutate函数生成新的列recode函数进行数据编码rename函数重命名字段arrange排序数据列select筛选数据filter过滤数据