深入浅出统计学01

Posted xiaoheng2020

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了深入浅出统计学01相关的知识,希望对你有一定的参考价值。

深入浅出统计学

框架

  1. 第一印象
  2. 集中趋势的度量
  3. 分散性与变异度的度量
  4. 概率计算
  5. 离散概率分布的运用
  6. 排列与组合
  7. 几何分布、二项分布及泊松分布
  8. 正态分布的运用
  9. 再谈正态分布的运用
  10. 统计抽样的运用
  11. 总体和样本的估计
  12. 置信区间的构建
  13. 假设检验的运用
  14. x^2分布
  15. 相关与回归

01 第一印象

基本概念

  1. 频数:频数是一种统计方法,用来描述一个类别中有多少个项。
  2. 频数密度:长方形高度用于度量一个特定组的频数的集中程度,是对频数密集度的一种度量,是用于说明数字到底是“稠密”还是“稀薄”的一种方法。长方形的高度称为频数密度。
  3. 累积频数:累加到某个特定数值为止的总频数。即频数的累计总和。通过累计频数可知到该数值点为止的总频数。例如,假设你有一些人的年龄数据。数值27的累积频数表示到27岁(包括27岁在内)为止的人有多少。

图形种类

  1. 饼图
  2. 条形图 - 条形图中的每一个长方形代表一个特定类,长方形的长度代表某种数值。长方形越长,数值越大。所有长方形的宽度都相等。
    1. 垂直条形图
    1. 水平条形图

标度

  1. 百分数标度
  2. 频数标度

处理多批数据

  1. 堆积条形图
  2. 分段条形图

数据的分类

  1. 类别数据(定性数据)
  2. 数据值数据(定量数据)

直方图和条形图的区别

    1. 每个长方形的面积与频数成正比
    1. 图上的长方形之间没有间隔

绘制区间相同的直方图

  • 查看每个区间,求出每个区间的宽度,以及每个区间涵盖的数据范围。同时要确保直方图的各个长方形之间没有间隔。
  • 为了保证各个长方形之间没有间隔,要适当的扩大第一个区间的结束范围,减少第二个区间的开始范围,从而形成一条唯一边界(一般是从中间会合)。扩大和缩小的点,对应的另一个端点也要一起调整从而保证区间范围不变。
  • 比如(0-99)、(200-399)在直方图中要用(-0.5-199.5)、(199.5-399.5)表示。

绘制区间不相等的直方图

  1. 求长方形的宽度 - 长方形所覆盖的数值范围就是长方形的宽度。
  2. 求长方形的高度
    1. 长方形面积 = 每组频数
    1. 长方形高度 = 频数 / 长方形宽度
长方形高度用于度量一个特定组的频数的集中程度,是对频数密集度的一种度量,是用于说明数字到底是“稠密”还是“稀薄”的一种方法。长方形的高度称为频数密度。
  1. 画出直方图
  • 纵坐标为频数密度

累计频数图(折线图)

累积频数:累加到某个特定数值为止的总频数。即频数的累计总和。通过累计频数可知到该数值点为止的总频数。例如,假设你有一些人的年龄数据。数值27的累积频数表示到27岁(包括27岁在内)为止的人有多少。

总结

  • 使用哪种图形归根结底在于你要传递的信息,以及你要提炼的主要事实。

以上是关于深入浅出统计学01的主要内容,如果未能解决你的问题,请参考以下文章

「游戏引擎 浅入浅出」4.3 片段着色器

「游戏引擎 浅入浅出」4.3 片段着色器

「游戏引擎 浅入浅出」4.3 片段着色器

c_cpp 快速代码片段,用于在统计(阻止)/ dev / rdsk中的设备时验证fstat64和stat64的行为。

深入理解DOM节点类型第四篇——文档片段节点DocumentFragment

实战并发编程 - 01多线程读写同一共享变量的线程安全问题深入剖析