在萨辛普森悖论中对独立性进行卡方检验

Posted

技术标签:

【中文标题】在萨辛普森悖论中对独立性进行卡方检验【英文标题】:Performing Chi square test for independence in sas- simpson paradox 【发布时间】:2014-06-25 13:55:43 【问题描述】:

我想了解学生在特定考试中的表现与辍学率之间是否存在关系。我有一个 2×2 矩阵,其中变量 Level in test 取值 level 1 和 level 2,变量 dropout 的值不是 active 和 active。 (可以说1级=通过测试,2级=未通过)。

我可以看出我对“辛普森悖论”这个术语有疑问,因为我知道教员中的每一个教育都有一个很高的 p 值,这表明考试水平和辍学之间没有关系。但是当我对数据进行分组并对整个教师进行分析时,我得到的 p 值很低,表明变量之间存在显着的关系。?? 我曾尝试阅读有关辛普森悖论的信息,但我似乎没有获得有关如何处理此问题的信息? 我读过一个地方不应该对聚合数据执行测试,但那不是真的吗?

我真的希望有人可以帮助我!

玛丽亚的问候

【问题讨论】:

【参考方案1】:

对于标有教育 2 和教育 5 的交叉表,您的单元格值小于 5,这违反了运行卡方的假设。关于卡方如何足够稳健地进行测试以承受这些限制,存在一些争论,但我仍然会重新考虑您的分组方法。

【讨论】:

在期望值小于 5 的交叉表中,我使用来自 Fishers 精确检验的 p 值。我想这可以吗?为什么要重新考虑分组方法?我不明白为什么我不能对数据进行分组?【参考方案2】:

由于“教师”中的案例总数较高,因此数据足以反驳独立假设,因此 p 值较低。当案例数量较少时(您的教育 1 到教育 5 表),没有足够的数据来显示显着性。这里较高的 p 值只是表示差异可能是偶然的。

这不是辛普森悖论的例子。

【讨论】:

以上是关于在萨辛普森悖论中对独立性进行卡方检验的主要内容,如果未能解决你的问题,请参考以下文章

进行卡方检验以检查独立或相关的值

独立性检验原理

卡方检验结果怎么看

卡方检验结果怎么看呀,

白话“卡方检验”

卡方检验| 独立性检验|相关性检验