阴性结果怎么办？基于R语言的可视化数据分析

Posted 2021-04-27 EmpowerStats

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了阴性结果怎么办？基于R语言的可视化数据分析相关的知识，希望对你有一定的参考价值。

临床上是个保护因素，自己数据做出来是个危险因素，是样本量不够大吗？还是数据质量不高？怎么办？

方案1

把“奇怪”的患者删掉。自己手动删数据，这跟造假、编数据没多大区别。不推荐。

方案2

扩大样本量。因为不知道为什么结果是反的，原因没有找到，盲目扩大样本量可能出力不讨好。不推荐。

方案3

基于R语言的可视化数据分析，看看高手是怎么做的吧。

实例

研究溶栓时间和不良预后的关系。临床上认为越早接受溶栓，预后越好。然而研究者的数据得出的结果却是相反的，曲线拟合结果如下：

阴性结果怎么办？基于R语言的可视化数据分析

横坐标是从发病到接受溶栓的时间，纵坐标是预后不良发生的概率（1=预后不良，0=没有预后不良）。红色的是曲线拟合，两边蓝色的是95%CI。看图可知早溶栓的不良预后概率高，这个临床解释不通啊。

阴性结果怎么办？基于R语言的可视化数据分析

问题就集中在左边圈出来研究对象，是他们导致结果很奇怪。下一步，想把这些人拎出来看看，到底有什么特殊性。想法很简单，实现起来也不难。可以用易侕软件数据分析菜单下的“诊断数据关联关系”模块实现。

把X（溶栓时间）放在X里，把Y（预后不良）放在Y里。点击查看结果。

阴性结果怎么办？基于R语言的可视化数据分析

结果出来了，可以看到按照预后不良分成两组，每个点是一个研究对象。可以在图上用鼠标拖拽选出右下方这些奇怪的人（即早接受溶栓治疗却预后差的）。

阴性结果怎么办？基于R语言的可视化数据分析

保存成一个组，其他的人是另一个组。自动计算其他所有变量在两组间的差异，可以看到第四个变量是房颤。发现选取的研究对象中房颤的发生率非常高，两组差异显著p<0.001。

阴性结果怎么办？基于R语言的可视化数据分析

临床上解释为：就算很早接受了溶栓治疗，因为房颤的原因预后还是很差的。这就提示我们在研究的排除标准里面加上一条：排除房颤患者，因为在房颤患者中观察不到早期溶栓对预后的改善作用。完美解决！感慨现在有数据的是爷，有好数据的是大爷。其实大爷也是从当孙子过来的，好数据不是天生就好的，要遇到会用的人才好。

这样做是不是玩弄数据呢？当然不是。如果研究者在做研究设计的时候，根据临床意义想到了这条排除标准，后面数据分析就不会出现这个问题了。然而谁能保证自己的研究设计是完美的呢？后期发现问题，就要及时补救。

怎么写排除标准和设置排除标准的原因呢？

可以参考这篇NEJM

这是2016年发表在新英格兰医学杂志的论文。题目是保留肺功能吸烟者的临床症状。文章排除了肥胖（BMI>40）的人，原因是既往文献报道肥胖可导致肺活量测定异常和呼吸困难，也就是跟本研究的Y关系密切的大混杂被排除了。

阴性结果怎么办？基于R语言的可视化数据分析

临床最大！临床医生做临床科研不要被统计学牵着鼻子走，不要被P值不显著吓到了。临床医生最懂临床现象，要善于思考、合理解释数据分析结果。做临床科研，常识common sense很重要！善用工具也很重要，基于数据挖掘开展二次科研设计，“诊断数据关联关系模块”是科研必备神器！本模块有详细的操作视频可供参考，点击文末阅读原文查看视频。

往期精彩回顾

登录易侕学院官网

点击“易侕下载”免费下载安装

http://www.empowerstats.com/empowerU/#

扫一扫，惊喜不断！

详细的操作视频，点击下方“ 阅读原文”查看。

以上是关于阴性结果怎么办？基于R语言的可视化数据分析的主要内容，如果未能解决你的问题，请参考以下文章