R语言四格表的统计分析及假设检验

Posted Data+Science+Insight

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了R语言四格表的统计分析及假设检验相关的知识,希望对你有一定的参考价值。

R语言四格表与列联表的统计分析及假设检验

卡方检验是一种确定两个分类变量之间是否存在显着相关性的统计方法。 这两个变量应该来自相同的人口,他们应该是类似 是/否,男/女,红/绿等。

例如,我们可以建立一个观察人们的冰淇淋购买模式的数据集,并尝试将一个人的性别与他们喜欢的冰淇淋的味道相关联。 如果发现相关性,我们可以通过了解访问的人的性别的数量来计划适当的味道库存。

卡方检验是一种用途很广的计数资料的假设检验方法,由卡尔·皮尔逊提出。它属于非参数检验的范畴,主要是比较两个及两个以上样本率( 构成比)以及两个分类变量的关联性分析。其根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题。

它在分类资料统计推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等。

可以分为成组比较(不配对资料)和个别比较(配对,或同一对象两种处理的比较)两类。

通常卡方检验的应用主要为:
1、 卡方拟合优度检验
2、卡方独立性检验

四格卡方检验的标准做法

我们想知道不吃晚饭对体重下降有没有影响,并获得以下数据:

吃晚饭与体重的关系

建立假设检验:

H0:r1=r2,不吃晚饭对体重下降没有影响,

以上是关于R语言四格表的统计分析及假设检验的主要内容,如果未能解决你的问题,请参考以下文章

R语言多因素方差分析及评估假设检验

自助法(bootstrap)在统计检验中的应用及R语言实现过程

R语言 | 卡方检验(Chi-squaretest)

R语言描述性统计分析:假设检验

如何使用R语言进行卡方检验

R语言生存分析Log-rank假设检验组间生存曲线比较实战