数据分析

Posted cdoi-24374

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据分析相关的知识,希望对你有一定的参考价值。

引言

引言提示

(color{red}{oxed{color{blue}{large{ ext{太基础了,建议跳过。}}}}})

代数式规则

这东西基础的不能再基础了

  1. 省略乘号:(x imes y=xy)

  2. 数字优先:(x imes a=ax) ((a)为常数)

  3. 相同代数的积用乘方:(prod_{i=1}^{n}x=x^n)

  4. 除法用分数:(xdiv y=dfrac{x}{y})

  5. (pm 1)与代数相乘省略:((-1)x=-x,1x=x)

平方根

为了了解数据分析,我们先从平方根入手。

首先几个简单公式。

(sqrt{a^2}=|a|)

(asqrt{c}+bsqrt{c}=(a+b)sqrt{c})

(asqrt{c}-bsqrt{c}=(a-b)sqrt{c})

(sqrt{a}sqrt{b}=sqrt{ab})

(dfrac{sqrt{a}}{sqrt{b}}=sqrt{dfrac{a}{b}})

(sqrt{a^2b}=asqrt{b})

用这些式子可以化简二次根式

分配律

((m+n)x=mx+nx)

多项式展开

((m+n)(x+y)=mx+my+nx+ny)
((x+a)(x+b)=x^2+(a+b)x+ab)
((x-a)^2=x^2-2ax+a^2)
((x+a)^2=x^2+2ax+a^2)
((x+a)(x-a)=x^2-a^2)

倍数辨别方法

虽然这东西是我自己写的,但是预览和实际差别太大。。。所以我把预览截图下来用了。。

正文

平均数

对于数据(x_1,x_2,x_3,x_4,dots,x_n)
他们的平均数如下表示:
[overline{x}=dfrac{sum_{i=1}^nx_i}{n}]

方差

对于数据(x_1,x_2,x_3,x_4,dots,x_n)
他们的方差如下表示:
[V_x=dfrac{(x_1-overline{x})^2)+(x_2-overline{x})^2)+(x_3-overline{x})^2)+dots+(x_n-overline{x})^2)}{n}]
简洁的写法:
[V_x=dfrac{1}{n}sum_{i=1}^n(x_i-overline{x})^2]
还有一种求法:
[V_x=overline{x^2}-overline{x}^2]

标准差

对于数据(x_1,x_2,x_3,x_4,dots,x_n)
他们的标准差如下表示:
[s_x=sqrt{V_x}=sqrt{dfrac{(x_1-overline{x})^2)+(x_2-overline{x})^2)+(x_3-overline{x})^2)+dots+(x_n-overline{x})^2)}{n}}]
当然,还有简洁的写法:
[s_x=sqrt{dfrac{1}{n}sum_{i=1}^n(x_i-overline{x})^2}]
和另一种求法:
[s_x=sqrt{overline{x^2}-overline{x}^2}]

偏差

偏差提示

偏差这个概念为日本特有的评分标准。

偏差的计算方法

对于数据(x_1,x_2,x_3,x_4,dots,x_n)
[i ext{的偏差}= ext{标准}+dfrac{x_i-overline{x}}{s_x}]

其中,标准一般取(50)

附录

协方差

(x)(y)的协方差写作:
[C_{xy}=dfrac{sum_{i=1}^n[(x_i-overline{x})(y_i-overline{y})]}{n}]

相关系数

(x)(y)的相关系数写作:
[r_{xy}=dfrac{c_{xy}}{s_xs_y}]
其中,(-1le r_{xy}le 1),且(r_{xy})(c_{xy})变化。

关于相关系数,还是不要说太多的好(QAQ),所以现在内容结束。

以上是关于数据分析的主要内容,如果未能解决你的问题,请参考以下文章

大数据分析一般用啥工具分析

大数据分析工具详尽介绍&数据分析算法

数据分析中如何清洗数据

大数据分析工具有哪些?

学数据分析与数据挖掘用啥技术

第一章数据分析介绍