使用 Fisher 精确检验、卡方检验测试独立性时的双边/单边特定目的
Posted
技术标签:
【中文标题】使用 Fisher 精确检验、卡方检验测试独立性时的双边/单边特定目的【英文标题】:Purposes of two-sided/one-sided specific while testing independence with Fisher's exact test, Chi-square test 【发布时间】:2021-11-19 07:24:25 【问题描述】:我很难理解 Fisher 精确检验和卡方检验背后的操作。据我了解,这两个测试都做同样的事情,即测试两个分类数据之间的独立性。 例如,我有如下列联表:
Men Women
Studying 1 9
Not-studying 11 3
然后使用费舍尔检验会告诉我学习个体的比例对于两种性别是否相同(即学习比例是否与性别无关)。对吗? 如果是,那么为什么我们需要指定它应该是 Fisher 检验/卡方检验的双边检验还是单边检验?因为我不认为独立性测试与双面或单面测试有任何关系? 我是否遗漏了什么,或者我们在计算 Fisher/Chi-square 时实际上需要指定它是双面还是单面?
【问题讨论】:
CrossValidated 可能是发布此问题的更好地方。无论如何,作为理解的开始,无论是在这里还是那里,都可以编辑问题以包括与这些数据相对应的“预期值”(如果零假设为真,理想数据将是什么),以及两组相反的假设极端如果零假设不正确,可能出现的数据。这也是previous question 的副本。 【参考方案1】:是的,卡方检验可用于测试独立性(在您的情况下,学习比例与性别无关)。您无需担心是双面还是单面。让我详细说明
观察表:
Men | Women | Total | |
---|---|---|---|
Studying | 1 | 9 | 10 |
Not-studying | 11 | 3 | 14 |
Total | 12 | 12 | 24 |
H0 : 学习的学生比例与性别无关
H1:学习的学生比例取决于性别
对于独立的变量,即对于独立的性别和学习比例,上表应如下所示
期望表独立:
Men | Women | Total | |
---|---|---|---|
Studying | 5 | 5 | 10 |
Not-studying | 7 | 7 | 14 |
Total | 12 | 12 | 24 |
由于其不分性别,其分布均等
现在卡方系数测量如下:
Summation over all the cells (observed - expected)^2/expected
在这种情况下是 10.97
高卡方值: 较高的卡方值意味着,观察值与期望值之间的差异较大,差异较大表示观察到的序列不符合预期的独立性,我们可以拒绝Null假设
低卡方值: 低卡方值意味着观察值和期望值之间的差异很小,即观察值符合独立条件的预期,我们可以接受零假设
简而言之,较高的卡方值拒绝 Null 假设,而较小的卡方值接受 Null 假设。这意味着卡方始终是单尾检验,拒绝区域位于右侧。
在计算Fisher/Chi-square时,我们不需要指定是双面还是单面。
【讨论】:
以上是关于使用 Fisher 精确检验、卡方检验测试独立性时的双边/单边特定目的的主要内容,如果未能解决你的问题,请参考以下文章
R语言分类变量独立性检验(Tests of independence)使用Fisher精确检验fisher.test函数检验分类变量的独立性( test of independence)