R_Studio对数值型数据进行统计量分析

Posted 1138720556gary

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了R_Studio对数值型数据进行统计量分析相关的知识,希望对你有一定的参考价值。

 

 

  对“Gary.csv”中的成绩数据进行统计量分析

技术分享图片

 

技术分享图片

 

 基础数据分析

  均值 中位数 极差   标准差   变异系数 1/4分位数 3/4分位数 四分位间距... ...分析

 

 

技术分享图片

 

技术分享图片
setwd(D:\\data)                            #更改工作目录
list.files()                                #列出当前工作目录下的文件
dat=read.csv(file="Gary.csv",header=TRUE)    #读取"Gary.csv文件"

dats=dat[,3]     #对大学体育成绩进行分析

# 统计量分析
#平均分
mean_ = mean(dats,na.rm=T)
# 中位数
median_ = median(dats,na.rm=T)
# 极差
range_ = max(dats,na.rm=T)-min(dats,na.rm=T)
# 标准差
std_ = sqrt(var(dats,na.rm=T))
# 变异系数
variation_ = std_/mean_
# 四分位数间距
q1 = quantile(dats,0.25,na.rm=T)
q3 = quantile(dats,0.75,na.rm=T)
distance = q3-q1
a=matrix(c(mean_,median_,range_,std_,variation_,q1,q3,distance),1,byrow=T)
colnames(a)=c("均值","中位数","极差","标准差","变异系数","1/4分位数","3/4分位数","四分位间距")
print(a) 
Gary.R

 

 平均值mean(x, trim = 0, na.rm = FALSE, ...)  传送门

   x - 是输入向量。

  trim - 用于从排序的向量的两端删除一些观测值。

    na.rm - 用于从输入向量中删除缺少的值。

 

中位数median(x, na.rm = FALSE) 

   x - 是输入向量。 

  na.rm - 用于从输入向量中删除缺少的值。

 

 

 

 

其它数据分析方法  

  线性回归  传送门

  多元回归

  逻辑回归

  正态分布  传送门

  二项分布  传送门

  泊松回归  传送门

  协方差分析

  时间序列分析

  非线性最小二乘法

  决策树  传送门

  随机森林

  生存分析卡方检验

 


以上是关于R_Studio对数值型数据进行统计量分析的主要内容,如果未能解决你的问题,请参考以下文章

分类数据分析

统计学中,分类数据,顺序数据和数值数据三者的区别吗

R_Studio(关联)简单对数据进行关联分析

R_Studio(关联)对Groceries数据集进行关联分析

R_Studio(关联)对dvdtrans.csv数据进行关联规则分析

数据分析概况02:《深入浅出统计学》——基本统计量1