如何用Excel计算P值?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何用Excel计算P值?相关的知识,希望对你有一定的参考价值。

Microsoft Excel 提供了一组数据分析工具,称为“分析工具库”,在建立复杂统计或工程分析时可节省步骤。只需为每一个分析工具提供必要的数据和参数,该工具就会使用适当的统计或工程宏函数,在输出表格中显示相应的结果。其中有些工具在生成输出表格时还能同时生成图表。



相关的工作表函数 Excel 还提供了许多其他统计、财务和工程工作表函数。某些统计函数是内置函数,而其他函数只有在安装了“分析工具库”之后才能使用。



访问数据分析工具 “分析工具库”包括下述工具。要使用这些工具,请单击“工具”菜单上的“数据分析”。如果没有显示“数据分析”命令,则需要加载“分析工具库”加载项 (加载项:为 Microsoft Office 提供自定义命令或自定义功能的补充程序。)程序。



方差分析



方差分析工具提供了几种方差分析工具。具体使用哪一种工具则根据因素的个数以及待检验样本总体中所含样本的个数而定。



方差分析:单因素 此工具可对两个或更多样本的数据执行简单的方差分析。此分析可提供一种假设测试,该假设的内容是:每个样本都取自相同基础概率分布,而不是对所有样本来说基础概率分布都不相同。如果只有两个样本,则工作表函数 TTEST 可被平等使用。如果有两个以上样本,则没有合适的 TTEST 归纳和“单因素方差分析”模型可被调用。



方差分析:包含重复的双因素 此分析工具可用于当数据按照二维进行分类时的情况。例如,在测量植物高度的实验中,植物可能使用不同品牌的化肥(例如 A、B 和 C),并且也可能放在不同温度的环境中(例如高和低)。对于这 6 对可能的组合 化肥,温度,我们有相同数量的植物高度观察值。使用此方差分析工具,我们可检验:



使用不同品牌化肥的植物的高度是否取自相同的基础总体;在此分析中,温度可以被忽略。
不同温度下的植物的高度是否取自相同的基础总体;在此分析中,化肥可以被忽略。 


是否考虑到在第 1 步中发现的不同品牌化肥之间的差异以及第 2 步中不同温度之间差异的影响,代表所有 化肥,温度 值的 6 个样本取自相同的样本总体。另一种假设是仅基于化肥或温度来说,这些差异会对特定的 化肥,温度 值有影响。



方差分析:无重复的双因素 此分析工具可用于当数据按照二维进行分类且包含重复的双因素的情况。但是,对于此工具,假设每一对值只有一个观察值(例如,在上面的示例中的 化肥,温度 值)。使用此工具我们可以应用方差分析的第 1 和 2 步检验:包含重复的双因素情况,但没有足够的数据应用第 3 步的数据。



相关系数



CORREL 和 PEARSON 工作表函数可计算两组不同测量值变量之间的相关系数,条件是当每种变量的测量值都是对 N 个对象进行观测所得到的。(任何对象的任何丢失的观测值都会引起在分析中忽略该对象。)系数分析工具特别适合于当 N 个对象中的每个对象都有多于两个测量值变量的情况。它可提供输出表和相关矩阵,并显示应用于每种可能的测量值变量对的 CORREL(或 PEARSON)值。



与协方差一样,相关系数是描述两个测量值变量之间的离散程度的指标。与协方差的不同之处在于,相关系数是成比例的,因此它的值独立于这两种测量值变量的表示单位。(例如,如果两个测量值变量为重量和高度,如果重量单位从磅换算成千克,则相关系数的值不改变)。任何相关系数的值必须介于 -1 和 +1 之间。



可以使用相关分析工具来检验每对测量值变量,以便确定两个测量值变量的变化是否相关,即,一个变量的较大值是否与另一个变量的较大值相关联(正相关);或者一个变量的较小值是否与另一个变量的较大值相关联(负相关);还是两个变量中的值互不关联(相关系数近似于零)。



协方差



“相关”和“协方差”工具可在相同设置下使用,当您对一组个体进行观测而获得了 N 个不同的测量值变量。“相关”和“协方差”工具都可返回一个输出表和一个矩阵,分别表示每对测量值变量之间的相关系数和协方差。不同之处在于相关系数的取值在 -1 和 +1 之间,而协方差没有限定的取值范围。相关系数和协方差都是描述两个变量离散程度的指标。



“协方差”工具为每对测量值变量计算工作表函数 COVAR 的值。(当只有两个测量值变量,即 N=2 时,可直接使用函数 COVAR,而不是协方差工具)在协方差工具的输出表中的第 i 行、第 j 列的对角线上的输入值就是第 i 个测量值变量与其自身的协方差;这就是用工作表函数 VARP 计算得出的变量的总体方差。

参考技术A 在“EXCEL选项”中有“加载项”一项,可以用来查看和管理加载项,其中就有“分析工具库”。双击它,会打开(OPEN)1个窗口,选中你要的内容,点击“确定”。 参考技术B P(T<=t)
单尾
9.71817E-49
P(T<=t)
双尾
1.94363E-48
这就是P值啊,9.71817E-49就是9.71817*10^(-49),这个P值很小,是拒绝原假设的P值
参考技术C P(T<=t)
单尾
9.71817E-49
P(T<=t)
双尾
1.94363E-48
这就是P值啊,9.71817E-49就是9.71817*10^(-49),这个P值很小,是拒绝原假设的P值
参考技术D 详细操作步骤如下:

1、若为office2010则选择文件,点击选项打开,待加载项后找到一个“分析工具库”点击“转到”;

2、 若为office2003,则点击工具打开加载项;

3、使用“分析工具库”,点“确定”;

4、在“数据”菜单里面,找到“数据分析”;

5、点击选择开始分析,即可。

如何用python计算临界值(critical value)和p值(p value)(scipy)

z检验:

计算临界值:scipy.stats.norm.ppf(level_of_confidence)

计算p值:scipy.stats.norm.sf(abs(z_score)) 或 1-scipy.stats.norm.cdf(abs(z_score))---左尾或右尾,双尾检验需在此基础上乘以2

 

计算临界值例子:

from scipy.stats import norm
critical1=norm.ppf(0.95) #左尾或右尾
critical2=norm.ppf(0.975) #双尾

 

t检验:

计算临界值:scipy.stats.t.ppf(level_of_confidence, degree_of_freedom)

计算p值:scipy.stats.t.sf(abs(t_score),df) 或 1-scipy.stats.t.cdf(abs(t_score),df)---左尾或右尾,双尾检验需在此基础上乘以2

 

计算临界值例子:

from scipy.stats import t
critical1=t.ppf(0.95,10) #左尾或右尾
critical2=t.ppf(0.975,10) #双尾

 

卡方检验:

计算临界值:scipy.stats.chi2.ppf(level_of_confidence, degree_of_freedom)

计算p值:scipy.stats.chi2.sf(abs(chi2_score),df) 或 1-scipy.stats.chi2.cdf(abs(chi2_score),df)---左尾或右尾,双尾检验需在此基础上乘以2

 

计算临界值例子:

from scipy.stats import chi2
critical1=chi2.ppf(0.95,10) #左尾或右尾
critical2=chi2.ppf(0.975,10) #双尾

 

F检验:

计算临界值:scipy.stats.f.ppf(level_of_confidence, dfn, dfd)

计算p值:scipy.stats.f.sf(abs(chi2_score),dfn,dfd) 或 1-scipy.stats.chi2.cdf(abs(chi2_score),dfn,dfd)---左尾或右尾,双尾检验需在此基础上乘以2

 

计算临界值例子:

from scipy.stats import f
critical1=f.ppf(0.95,30,28) #左尾或右尾
critical2=f.ppf(0.975,30,28) #双尾

 

注:

cdf是概率的累积分布,即小于等于某个值出现的概率总和。

ppf是cdf的逆运算,也就是已知概率总和,求对应的统计量的值。

 

参考:https://machinelearningmastery.com/critical-values-for-statistical-hypothesis-testing/

以上是关于如何用Excel计算P值?的主要内容,如果未能解决你的问题,请参考以下文章

如何用EXCEL计算年龄,精确到月和天,并筛选

Excel中,如何计算用Large函数找出的第二最大值所在行

如何用excel计算出年龄?

如何用excel计算标准差的方法

如何用Excel画直方图

如何用Excel算日期差,而且能算出相差几年几个月?