评估具有不同长度的多个二进制测试答案的正确统计测试/ R 函数是啥?

Posted

技术标签:

【中文标题】评估具有不同长度的多个二进制测试答案的正确统计测试/ R 函数是啥?【英文标题】:What's the correct statistical test/R function for assessing multiple, binary test answers with different lengths?评估具有不同长度的多个二进制测试答案的正确统计测试/ R 函数是什么? 【发布时间】:2020-06-16 20:43:04 【问题描述】:

我有很多问题。每个参与者都必须从该池中回答相同数量的随机问题。然后我根据另一个变量将参与者分成两组。

我如何评估哪个组在 R 中表现更好?

【问题讨论】:

在这样的地方问这种问题不会得到太多帮助。一个更合适的问题可能是:“我如何在 R 中执行非配对 t 检验?”或“我如何才能最好地可视化由 R 中的另一个变量分层的结果变量的分布?”。更好的是,显示一小部分数据(参见dput)。听起来怎么样? 感谢 Edward — 这实际上不是我最初的问题,但有人建议进行这些编辑。我在 T 测试上没问题,但我只是不确定当我有两组时正确的统计测试是什么,其中一组数据看起来像:q1 q2 q3 1 0 1 0 1 NA NA 0 1 and group two something喜欢:q1 q2 q3 1 0 NA NA 1 0 1 0 1(我的实际数据有 6 个问题和 49 名参与者)谢谢, 【参考方案1】:

那么让我们尝试这样的事情:

df = data.frame(id=1:49,
q1 = sample(0:1,49,prob=c(0.7,0.3),replace=TRUE),
q2 = sample(0:1,49,prob=c(0.5,0.5),replace=TRUE),
q3 = sample(0:1,49,prob=c(0.3,0.7),replace=TRUE),
group = sample(c("a","b"),49,replace=TRUE)
)

您可以使用每列上的 Fisher 测试来测试每个问题与组的关联,例如下面我们在 q1 和组之间进行:

fisher.test(table(df$q1,df$group))

    Fisher's Exact Test for Count Data

data:  table(df$q1, df$group)
p-value = 0.5072
alternative hypothesis: true odds ratio is not equal to 1
95 percent confidence interval:
 0.09971675 2.43186118
sample estimates:
odds ratio 
 0.5346084 

如果问题相关,可以设置混合模型,并且有个人的影响:

library(lme4)
newdf = pivot_longer(df,-c(id,group))
glmer(value ~ name*group + (1|id),data=newdf,family="binomial")

我认为 Fisher 测试对你来说可能是最直接的。

【讨论】:

以上是关于评估具有不同长度的多个二进制测试答案的正确统计测试/ R 函数是啥?的主要内容,如果未能解决你的问题,请参考以下文章

C语言期末第七弹

软件测试是否通过的评估手段

IMIX功能测试——网络测试仪实操

IMIX功能测试——网络测试仪实操

质量模型

训练集、验证集和测试集