在萨辛普森悖论中对独立性进行卡方检验
Posted
技术标签:
【中文标题】在萨辛普森悖论中对独立性进行卡方检验【英文标题】:Performing Chi square test for independence in sas- simpson paradox 【发布时间】:2014-06-25 13:55:43 【问题描述】:我想了解学生在特定考试中的表现与辍学率之间是否存在关系。我有一个 2×2 矩阵,其中变量 Level in test 取值 level 1 和 level 2,变量 dropout 的值不是 active 和 active。 (可以说1级=通过测试,2级=未通过)。
我可以看出我对“辛普森悖论”这个术语有疑问,因为我知道教员中的每一个教育都有一个很高的 p 值,这表明考试水平和辍学之间没有关系。但是当我对数据进行分组并对整个教师进行分析时,我得到的 p 值很低,表明变量之间存在显着的关系。?? 我曾尝试阅读有关辛普森悖论的信息,但我似乎没有获得有关如何处理此问题的信息? 我读过一个地方不应该对聚合数据执行测试,但那不是真的吗?
我真的希望有人可以帮助我!
玛丽亚的问候
【问题讨论】:
【参考方案1】:对于标有教育 2 和教育 5 的交叉表,您的单元格值小于 5,这违反了运行卡方的假设。关于卡方如何足够稳健地进行测试以承受这些限制,存在一些争论,但我仍然会重新考虑您的分组方法。
【讨论】:
在期望值小于 5 的交叉表中,我使用来自 Fishers 精确检验的 p 值。我想这可以吗?为什么要重新考虑分组方法?我不明白为什么我不能对数据进行分组?【参考方案2】:由于“教师”中的案例总数较高,因此数据足以反驳独立假设,因此 p 值较低。当案例数量较少时(您的教育 1 到教育 5 表),没有足够的数据来显示显着性。这里较高的 p 值只是表示差异可能是偶然的。
这不是辛普森悖论的例子。
【讨论】:
以上是关于在萨辛普森悖论中对独立性进行卡方检验的主要内容,如果未能解决你的问题,请参考以下文章