R语言—统计函数

Posted 大康的笔记

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了R语言—统计函数相关的知识,希望对你有一定的参考价值。

之前的文章介绍了非常强大的tidyr包和dplyr包可以对数据进行格式转化、缺失值处理、数据的整合连接等一系列的操作。之后,我们就要对数据进行统计分析,这时候就要用到非常多的与统计相关的函数,比如概率分布函数、频数统计函数、独立性检验的函数等等。

图片来源于B站

频数和频率的统计在数据分析时是一个非常基本并且重要的一个步骤,比如说在分析不同组之间的差异时,都要先进行频数的处理,下面主要介绍用table函数进行频数统计的用法。
频数统计的过程也称作是创建列联表的过程,可分为一维列联表、二维列联表和三维列联表,下面会逐一列举不同列联表的创建。 (以下代码均由R 4.0.1版本创建)

#一维列联表

>mtcars$cyl<-as.factor(mtcars$cyl)#转化为因子

>split(mtcars,mtcars$cyl)#对其进行分组

>cut(mtcars$mpg,c(seq(10,50,10)))#将数据分为4个区间

>table(cut(mtcars$mpg,c(seq(10,50,10))))#统计不同区间内的频数

>prop.table(table(mtcars$mpg))*100#计算频率值

#二维列联表

>mtcars

>table(mtcars$mpg,mtcars$cyl)

>with(data=mtcars,table(mpg,cyl))

>xtabs(~mpg+cyl,data=mtcars)

>x<-xtabs(~mpg+cyl,data=mtcars)

>margin.table(x)#频数统计,可单独按照行和列进行处理

>margin.table(x,1)#按行统计

>margin.table(x,2)#按列统计

>addmargins(x)#添加到频数表中

>addmargins(x,1)#添加行

>addmargins(x,2)#添加列

#三维列联表

>y<-xtabs(~mpg+cyl+disp,data=mtcars)

>ftable(y)#将三维转换为平铺式

我将这些语句放在了R脚本中,可以直接导入运行,需要的朋友可以私信我哦!

扫描二维码

获取更多精彩

大康的笔记

R语言—统计函数(1)

以上是关于R语言—统计函数的主要内容,如果未能解决你的问题,请参考以下文章

R语言—统计函数

R语言之 常用的统计函数

R语言笔记 统计函数

R语言nchar函数统计字符串中字符个数实战

R语言nrow函数获取dataframe或者matrix行计数统计

R语言is.na函数实战(删除替换统计条件判断等)