参数估计与假设检验(beta版)
Posted 量子智能龙哥
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了参数估计与假设检验(beta版)相关的知识,希望对你有一定的参考价值。
目录
参数估计
核心思想
使用样本数据,构造统计量,进而估计总体数据中的参数。
点估计
估计的结果是一个点。
矩估计
矩 = 概率与随机变量 x 乘积。类比于力矩 = 力量 x 力臂的长度。当然这时一阶矩的概念。
这里的矩估计举个栗子就是用样本均值估计总体的期望。
似然估计
已知结果的情况下,找出参数使得该结果发生的概率最大。
关于点估计的评价
一致性:在样本增大的同时,估计值依概率无限接近实际值。
为什么说一致性是对估计量最基本的要求呢?因为抽取样本的时候我们并不能控制到底抽到什么样本值,唯一可能可控的是样本容量(有些情况下连样本容量都不能随意控制,比如地震的样本)。所以人们希望在样本容量增大时,估计的精度可以不断地提高。
无偏性:估计值的期望等于实际值。也就是没有系统性的误差,相当于是在物理实验中只有随机误差没有系统误差。
有效性:在同样无偏的估计下方差越小,估计越稳定有效。
区间估计
核心思想
为了查全率高一些,用区间来代替点。置信区间的宽窄,事实上就是查全率与查准率的平衡。太窄可能查准率有了查全率没有,太宽可能查全率有了但是查准率太低。
什么是置信区间
在这里阐述一下置信区间的定义。规定一个区间大小S。使得以X平均为中轴S宽度的情形且一定概率下(其中罩得住的概率可以指定,比如说90%罩得住)能够罩得住真实平均值μ(另一种说法是,我做100次X平均有90次能够罩得住μ)的区间称之为置信区间。
置信度也可以理解为我们有90%相信X平均在这个区域内。
需要注意的是
1.置信区间的宽度不会变,在置信区间内 X平均 向左右扩展置信宽度的范围内就会罩住真实的μ。置信区间会随着均值改变而改变。
2.区间的宽度要越小越好,这也说明了为什么在正态分布的时候我们要以μ为对称轴来取值。
置信区间的计算
上面已经给出了置信区间的定义。就是已知X平均的分布,要找到一个宽度(设宽度为L)尽可能小的区间,使得以随机变量X平均为中轴的宽度为L的区间有90%的把握(当然可以是其他的区间)能够罩得住μ。
一个事实
P
(
μ
1
<
X
‾
<
μ
2
)
=
90
%
P(μ_1 < \\overlineX< μ_2) = 90\\%
P(μ1<X<μ2)=90%
的对称区间所对应的宽度刚好就是我们所找的宽度。所以当我们找到一个随机了一个X平均再结合上面的宽度就得到了置信区间。也就是说上面的计算只是为了求出一个宽度。而之前我把它理解成置信区间
假设检验
核心思想
在一个实验中,根据直觉或者以往的经验构造
原
假
设
H
0
,
备
择
假
设
H
1
原假设H_0 ,备择假设H_1
原假设H0,备择假设H1
一般我们选择经验上概率较大的一个作为原假设,小概率的作为备择假设。
一个朴素的思想就是当实际情况是一个大概率事件的时候我们接受原假设。当实际发生的结果是一个小概率事件的时候我们相信备择假设。
当然我们的判断是有代价的,因为小概率事件不是不可能事件所以我们会在一定的概率基础上犯错。
计算模式
整体的计算步骤
1.提出假设
2.给出显著性水平(越小越严格),找出单边或者是双边的拒绝域。
3.做实验看结果是否落在拒绝域(也就是是否显著,在越严格的条件下仍然能够发生的就越显著)。
更为具体的实操步骤
1.提出假设。
2.给出显著性水平。
3.标准化+查表。
4.还原原始分布。
以上是关于参数估计与假设检验(beta版)的主要内容,如果未能解决你的问题,请参考以下文章
显著水平|区间估计|假设检验|显著性|第一类错误|Ⅱ类错误|β错误|t检验|连续性矫正|二项分布的假设检验|样本百分率|