统计分析术语描述

Posted wu-wu

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了统计分析术语描述相关的知识,希望对你有一定的参考价值。

1、集中趋势分析(Central of tendency)

大部分观察值向某一数值集中的趋势称为集中趋势,常用平均数指标来表示,各观察值之间大小参差不齐

集中量数-算术平均数、中位数(Median )、众数( mode )

2、离散程度分析( Tendency of dispersion)

频数由中央位置向两侧逐渐减少,称离散程度,是个体差异所致,可用一系列的变异指标来反映。

差异量数全距(Range)、四位方差(Quartile Deviation)、平均差(Mean Deviation)、方差 Variance)、标准差( Standard Deviation )、变异系数、偏态度和峰态度峰度( Kurtosis)、偏度( Skewness )

 

  在数据分析的时候,一般首先要对数据进行描述性统计分析( Descriptive Analysis )以发现其内在的规律,再选择进一步分析的方法。描述性统计分析要对调查总体所有变量的有关数据做统计性描述,主要包括数据的频数分析、数据的集中趋势分析、数据离散程度分析、数据的分布、以及一些基本的统计图形。

(1)数据的频数分析:在数据的预处理部分,利用频数分析和交叉频数分析来检验异常值。此外,频数分析也可以发现一些统计规律。比如说,收入低的被调查者用户满意度比收入高的被调查者高,或者女性的用户满意度比男性低等。不过这些规律只是表面的特征,在后面的分析中还要经过检验。

(2)数据的集中趋势分析:数据的集中趋势分析是用来反映数据的一般水平,常用的指标有平均值、中位数和众数等。

各指标的具体意义如下:

平均值:是衡量数据的中心位置的重要指标,反映了一些数据必然性的特点,包括算术平均值、加权算术平均值、调和平均值和几何平均值。

中位数:是另外一种反映数据的中心位置的指标,其确定方法是将所有数据以由小到大的顺序排列,位于中央的数据值就是中位数。

众数:是指在数据中发生频率最高的数据值。

如果各个数据之间的差异程度较小,用平均值就有较好的代表性;而如果数据之间的差异程度较大,特别是有个别的极端值的情况,用中位数或众数有较好的代表性。

(3)数据的离散程度分析:数据的离散程度分析主要是用来反映数据之间的差异程度常用的指标有方差和标准差。

方差是标准差的平方,根据不同的数据类型有不同的计算方法。

(4)数据的分布:在统计分析中,通常要假设样本的分布属于正态分布,因此需要用偏度和峰度两个指标来检查样本是否符合正态分布。偏度衡量的是样本分布的偏斜方向和程度;而峰度衡量的是样本分布曲线的尖峰程度。一般情况下,如果样本的偏度接近于0,而峰度接近于3,就可以判断总体的分布接近于正态分布。

(5)绘制统计图:用图形的形式来表达数据,比用文字表达更清晰、更简明。在 SPSS软件里,可以很容易的绘制各个变量的统计图形,包括条形图、饼图和折线图等。

以上是关于统计分析术语描述的主要内容,如果未能解决你的问题,请参考以下文章

数据分析常用术语

Android软件安全与逆向分析的Android术语

数据分析中的术语都有哪些,分别代表着什么意思?

100个数据分析常用指标和术语

100个数据分析常用指标和术语

100个数据分析常用指标和术语