数据挖掘——统计学分析(五:统计量)

Posted erma

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据挖掘——统计学分析(五:统计量)相关的知识,希望对你有一定的参考价值。

统计量

通过从总体中抽取样本构造适当的统计量,由样本性质推断总体性质的样本函数。


常用的统计量

1)样本均值

2)样本方差、标准差

3)样本的变异系数——C=根号(D(x))/E(x)

4)k阶距

5)中心距

6)样本偏度

7)样本峰度

注:偏度、峰度在质量控制和可靠性研究应用较多。

次序统计量

参数估计和假设检验的重要统计量。

1)最小、最大次序统计量

2)样本极差=最大统计量-最小统计量

3)中位数、分位数、四分位数

充分统计量

统计量加工过程中一点信息都不损失的统计量称为充分统计量。

关于分布的几个概念

抽样分布

总体的分布类型已知,则对于任一自然数n,都能导出统计量的分布数学表达式。精确的分布大多实在正态总体情况下得到的。

渐进分布

当抽样分布的n较大时,就用极限分布作为抽样分布的一种近似,这种极限分布称为渐进分布。

随机模拟获得的近似分布

通过反复的重复试验得到的观测值满足的分布。

由正态分布导出的几个重要分布

卡方分布

t分布

F分布

在方差分析、回归方程的显著性检验中有着重要的地位。

 

 
















以上是关于数据挖掘——统计学分析(五:统计量)的主要内容,如果未能解决你的问题,请参考以下文章

python数据统计量分析

数据分析概况02:《深入浅出统计学》——基本统计量1

6.数据分析 --描述性统计量和线性回归

6.数据分析 --描述性统计量和线性回归

Hive表数据量统计原理和源码分析

R_Studio对数值型数据进行统计量分析