阴性结果怎么办?基于R语言的可视化数据分析
Posted EmpowerStats
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了阴性结果怎么办?基于R语言的可视化数据分析相关的知识,希望对你有一定的参考价值。
临床上是个保护因素,自己数据做出来是个危险因素,是样本量不够大吗?还是数据质量不高?怎么办?
把“奇怪”的患者删掉。自己手动删数据,这跟造假、编数据没多大区别。不推荐。
扩大样本量。因为不知道为什么结果是反的,原因没有找到,盲目扩大样本量可能出力不讨好。不推荐。
基于R语言的可视化数据分析,看看高手是怎么做的吧。
研究溶栓时间和不良预后的关系。临床上认为越早接受溶栓,预后越好。然而研究者的数据得出的结果却是相反的,曲线拟合结果如下:
横坐标是从发病到接受溶栓的时间,纵坐标是预后不良发生的概率(1=预后不良,0=没有预后不良)。红色的是曲线拟合,两边蓝色的是95%CI。看图可知早溶栓的不良预后概率高,这个临床解释不通啊。
问题就集中在左边圈出来研究对象,是他们导致结果很奇怪。下一步,想把这些人拎出来看看,到底有什么特殊性。想法很简单,实现起来也不难。可以用易侕软件数据分析菜单下的“诊断数据关联关系”模块实现。
把X(溶栓时间)放在X里,把Y(预后不良)放在Y里。点击查看结果。
结果出来了,可以看到按照预后不良分成两组,每个点是一个研究对象。可以在图上用鼠标拖拽选出右下方这些奇怪的人(即早接受溶栓治疗却预后差的)。
保存成一个组,其他的人是另一个组。自动计算其他所有变量在两组间的差异,可以看到第四个变量是房颤。发现选取的研究对象中房颤的发生率非常高,两组差异显著p<0.001。
临床上解释为:就算很早接受了溶栓治疗,因为房颤的原因预后还是很差的。这就提示我们在研究的排除标准里面加上一条:排除房颤患者,因为在房颤患者中观察不到早期溶栓对预后的改善作用。完美解决!感慨现在有数据的是爷,有好数据的是大爷。其实大爷也是从当孙子过来的,好数据不是天生就好的,要遇到会用的人才好。
这样做是不是玩弄数据呢?当然不是。如果研究者在做研究设计的时候,根据临床意义想到了这条排除标准,后面数据分析就不会出现这个问题了。然而谁能保证自己的研究设计是完美的呢?后期发现问题,就要及时补救。
怎么写排除标准和设置排除标准的原因呢?
可以参考这篇NEJM
这是2016年发表在新英格兰医学杂志的论文。题目是保留肺功能吸烟者的临床症状。文章排除了肥胖(BMI>40)的人,原因是既往文献报道肥胖可导致肺活量测定异常和呼吸困难,也就是跟本研究的Y关系密切的大混杂被排除了。
临床最大!临床医生做临床科研不要被统计学牵着鼻子走,不要被P值不显著吓到了。临床医生最懂临床现象,要善于思考、合理解释数据分析结果。做临床科研,常识common sense很重要!善用工具也很重要,基于数据挖掘开展二次科研设计,“诊断数据关联关系模块”是科研必备神器!本模块有详细的操作视频可供参考,点击文末阅读原文查看视频。
登录易侕学院官网
点击“易侕下载”免费下载安装
http://www.empowerstats.com/empowerU/#
以上是关于阴性结果怎么办?基于R语言的可视化数据分析的主要内容,如果未能解决你的问题,请参考以下文章
R语言基于自定义函数构建xgboost模型并使用LIME解释器进行模型预测结果解释:基于训练数据以及模型构建LIME解释器解释一个iris数据样本的预测结果LIME解释器进行模型预测结果解释并可视化
R语言ggplot2可视化数据点重合的散点图数据点有重合使用geom_smooth函数基于lm方法拟合数据点之间的趋势关系曲线自定义数据点的大小色彩添加主标题副标题题注信息
R语言ggplot2可视化散点图可视化两个数值变量之间的关系使用geom_smooth函数基于loess方法拟合数据点之间的趋势关系曲线自定义数据点的大小色彩添加主标题副标题题注信息
R语言ggplot2可视化数据点重合的散点图数据点有重合使用geom_smooth函数基于lm方法拟合数据点之间的趋势关系曲线自定义数据点的大小色彩添加主标题副标题题注信息
R语言广义线性模型索赔频率预测:过度分散风险暴露数和树状图可视化
R语言层次聚类(hierarchical clustering):特征缩放抽取hclust中的聚类簇(cutree函数从hclust对象中提取每个聚类簇的成员)基于主成分分析的进行聚类结果可视化