猿创征文|基于反事实的因果推理Causal inference based on counterfactuals--一万六千字文献详细解读(因果关系的推理应用)全文总结
Posted 编程贝多芬
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了猿创征文|基于反事实的因果推理Causal inference based on counterfactuals--一万六千字文献详细解读(因果关系的推理应用)全文总结相关的知识,希望对你有一定的参考价值。
前言:
在研0的这个暑假当中,这篇文章也是对自己近两个月以来的部分学习做了一个ending!!在这段生活当中,经历了难受,经历了迷茫找不到一个属于自己的学习方法。写下这篇文章解读也对自己近段时间做了一个总结,也希望在以后的研究生生活当中能够坚持下去!保持现在对自己的严格标准!!保持自己的不服输,不甘心!!也希望这篇文章能够一直激励自己---“靡不有初,鲜克有终!”
文章框架:
一、研究背景意义:
①在流行病学和医学研究中,反事实或潜在结果模型已日益成为因果推断的标准。
②反事实是医学和流行病学中因果推断的基础。
③困难:观察性研究当中,对于反事实差异的估计有一定困难。
④对个体产生因果效应的唯一必要条件是该因素对其影响的优先性。
⑤100%的因果关系证据是不可能的。
⑥问题:人们在实践中可以收集多少因果效应的证据,以及什么统计模型可以为这些证据做出贡献。
⑦作者观点:认为因果效应的反事实模型抓住了健康科学中因果关系的大部分方面。
二、文章中运用到的公式及其符号:
① Xi = t 被治疗
Xi =c 没有治疗
Yi,t 被治疗的结果
Yi,c 未治疗的结果
②
:表示个体i的治疗水平t与治疗水平c之间存在因果关系
:表示不同处理之间影响的大小---两种治疗水平之间结果的差异
③
:表示不再有其他症状,类似于治疗成功
:表示患有的疾病继续存在
④
:可估计表示平均因果效应,前提是X=c和X=t的个体是“可交换的”
⑤
:对超加性风险差异的表示---(X=1和Z=1)的影响高于(X=1和Z=0)和(X=0和Z=1)的影响之和再减(X=0和Z=0)的影响
⑥
:表示倾向评分--倾向评分是个体i被分配到治疗t的概率——在发生组分配到X=c或X=t时,用PSi=P表示(Xi=t)
⑦
:表示54岁死于癌症
⑧
:
RF:表示归因分数即由于暴露导致的超额发病率--相对于暴露后的发病率
IRX = 0 :暴露的目标人群的发病率
IRX=1 :未暴露目标人群的发病率
⑨
:(也证明了RF与PC不同)
EF:被定义为暴露者中患有该疾病的比例。
C1暴露后导致疾病加速发作的个体数量
C2暴露导致发病的人数
CT暴露的总人数
⑩
:表示暴露对于暴露者产生的影响概率很低,则归因分数≈A2/AT,也被称为超额率
三、对文章的详细剖析:
在文章的摘要方面,大致介绍了文章写作背景、分哪些因素进行讨论、可能遇到的一些困难等
①写作背景:在流行病学和医学研究中,反事实或潜在结果模型已日益成为因果推断的标准。
②估计因果效应时的影响因素:因果相互作用、不完善的实验、混杂因素的调整、随时间变化的暴露、竞争风险和因果关系的概率。
③可能遇到的困难:反事实是医学和流行病学中因果推断的基础;在观察性研究当中估计反事实差异有一些困难,并没有使反事实的本质失效
④文章观点:反事实模型因果效应的模型抓住了健康科学中因果关系的主要方面
第二部分:
1、在文章的背景方面,首先提出了几个重要的概念以及文章作者的观点:
①个体因果效应的唯一必要条件是因素优先于其效应
②100% 的因果关系证据是不可能的
③问题是在实践中可以收集多少因果效应的证据,以及哪些统计模型可以为这些证据做出贡献
④作者观点:认为因果效应的反事实模型涵盖了健康科学中因果关系的大部分方面
2、对该部分进行详细讲述:
首先提出几乎每个实证研究问题都是因果关系通过医学和流行病学研究的科学家们调查的问题---“哪些因素导致某种疾病?”或者“某种疗法如何影响疾病的持续时间和病程?”等问题引出---不是每一个关联都是暂时性的,也不是每一个暂时性的关联都涉及到因果关系,但也可能是有因果关系的。牵涉到因果成分,可能是计量误差、共同的先验因素或其他偏见造成的偏差所致的结论。(康德的“先验”是什么意思:先验意即在经验之前。我们大部分的知识都来源于「经验」,我们在认识事物的时候,总要看一下,摸一下,闻一下,或者你也可以称其为「实验」,但是康德认为有一些东西是存在于经验之前的,这些东西的属性我们可以叫做「先验性」。)
随后概要讲述了有关因果关系在哲学领域中的争论历史,随之讲述了作者自己的观点--认为因果效应的反事实模型涵盖了健康科学中因果关系的大部分方面 阐述了文章所要详细讲述的问题和文章的模块--“在讨论部分的前两节,定义了因果效应的反事实模型,并讨论了统计推断的一些一般问题。接下来的几章概述了随机和非随机研究中的因果交互作用和因果推断。在最后两节中,回顾了几个特殊的主题和相关的方法来评估因果效应。”
第三部分(Discussion):
一、因果效应的反事实模型
1、因果效应的反事实模型:文章该部分的讨论方面提出了一些结论和定义以及方法的推荐
①除非因素X和结果Y是可测量的量,否则统计学不能对因果推断作出贡献
②temporal direction可以通过大量的知识来进行确定,但大量知识可能不确定甚至错误
③因果顺序理想地由在测量结果之前已经操纵的实验中的条件来保证
④最好从前瞻性设计中推断temporal direction
⑤在非实验研究中,测量误差不仅可能发生在X和Y上,而且可能发生在temporal direction的评估上
⑥个体因果效应
2、对该部分进行详细讲述:
首先讲述了想要统计数据对因果推断做出贡献的前提条件--因素X和结果Y是可测量的量,
接着通过例子“性别可能影响人的食欲”说明了暂时性的一些影响因素可以通过大量的知识去评估,但大量知识可能不确定甚至错误的想法。
如果进行实验是可行的话对因和果的顺序保证条件——由在测量结果之前已经操纵的实验中的条件来保证,如果实验是不可行的通过例子“基线评估时报告的创伤事件作为随访期间偶发抑郁症的潜在风险因素”--(简单点说就是创伤事件可能作为偶发抑郁症的风险因素)--得出最好从前瞻性设计中推断这种暂时性的关联(temporal direction)而不是在横断面研究中回顾性收集暂时性关联(temporal direction)的信息。
(横断面研究(cross-sectional study)是通过对特定时点和特定范围内人群中的疾病或健康状况和有关因素的分布状况的资料收集、描述,从而为进一步的研究提供病因线索。它是描述流行病学中应用最为广泛的方法。)
(前瞻性设计:旨在从前瞻视角出发,思辨性地跳脱固有僵化观念的束缚,展望未来场景的可能;并以此反思当今社会的问题,先验创新或防微杜渐。)
在非实验研究中,测量误差不仅可能发生在X和Y上,而且可能发生在暂时性的关联(temporal direction)的评估上。
最后通过假设对个体i的因果效应进行了说明--假设我们想要评估指数治疗或暴露水平t(例如,服用特定药物)与另一治疗或暴露程度c(例如,未治疗)对结果Yi的影响,根据Greenland and Brumback ,我们在反事实推理中基本上假设:
①在指定的固定时间点,可以将个体i分配到两个治疗水平(Xi=t或Xi=c)
②结果Yi在Xi=t(用Yi,t表示)和Xi=c(用Yi,c表示)下都存在--(即两种结果都存在)
什么是反事实或者潜在结果?
(2)反事实和潜在结果
1、反事实和潜在结果:文章的该部分首先对上一部分的假设进行了分析,进而在上述假设的前提上解释了什么是反事实治疗?什么是反事实和潜在结果?也说明了有些因素不能作为反事实因果关系进行验证;也通过哲学的范畴论证了反事实的内容
①:没有接受的治疗称为反事实治疗。同样,这种治疗的结果被称为反事实或潜在结果
②:“潜在结果”一词反映了治疗任务前的观点,在统计学中更为广泛
③:有意义的反事实构成了个人i在固定分配时间的主要可能条件
④:当人类处理“如果”问题时,反事实思考似乎在创造力中起着至关重要的作用
2、对该部分进行详细讲述:
首先对上一部分的假设进行了阐述:如果个体i被分配到治疗水平t,则Yi,c是不可观察的;同样,如果个体i被分配到治疗水平c,则Yi,t是不可观察的。进而得出反事实或潜在结果的定义:没有接受的治疗称为反事实治疗。同样,这种治疗的结果被称为反事实或潜在结果。
---对于“潜在结果”反映了治疗分配前的观点,反事实结果表示治疗分配后的观点。
通过例子“对于男性来说,患有某种妇科疾病,而不是没有这种疾病,将是一种奇怪的反事实情况”得出了有意义的反事实构成了个人i在固定分配时间的主要可能条件的结论。也进而说明了在大多数情况下,性别、种族、年龄或基因型等内在变量的“影响”无法通过反事实因果关系进行检验。最后说明了反事实的重要性:当人类处理“如果”问题时,反事实思考似乎在创造力中起着至关重要的作用
(3)因果效应的定义
1、因果效应的定义:文章的该部分首先说明了怎么样才存在因果关系?如何定义产生影响的大小?也说明了因果效应衡量标准选择的重要性以及二元结果的反事实因果效应的定义
①:如果两种情况下的结果不同,则在分配治疗时,个体i的治疗水平t与治疗水平c之间存在因果关系
②:治疗水平之间的结果差异可以衡量因果效应影响的大小
③:衡量标准的选择影响了个体效应汇总作为总体平均效应的可解释性,以及个体效应的异质性作为因果相互作用的可理解性
④:二元结果中的因果效应是相互存在的,不会单独而存在
2、对该部分进行详细讲述:
首先解释如何证明存在因果关系:如果两种情况下的结果不同,则在分配治疗时,个体i的治疗水平t与治疗水平c之间存在因果关系,接着治疗水平之间的结果差异可以衡量因果效应影响的大小。通过衡量标准的选择说明了因果效应衡量标准选择的重要性:衡量标准的选择影响了个体效应汇总作为总体平均效应的可解释性,以及个体效应的异质性作为因果相互作用的可理解性(异质性(Heterogeneity)是指⼀些事物在某些特征上存在差异。在Meta分析中,异质性指纳⼊的不同研究之间存在的差异。异质性是遗传学概念,⼀种遗传性状可以由多个不同的遗传物质改变所引起。)
随后提出了“二元结果中的因果效应”的概念,通过假设--我有一个人患有某种特定的疾病。在接受某种治疗(Xi=t)后,患者不再有任何疾病症状(Yi,t=0)。问题是,与另一个治疗水平(例如,Xi=c:“未治疗”)相比,该治疗是否是疾病缓解的原因。---简单点说明,在反事实的概念当中,这个问题等同于如果同时将比较治疗水平c分配给同一个人i,疾病是否会持续,也就是说,Yi,c=1。借用David Hume的话点明了二元结果中的因果效应是相互存在的,不会单独而存在这个结论。
(4)选择参考治疗方法
1、选择参考治疗方法:该部分就是简单的介绍了评估反事实因果效应的第一个困难,分析对比了药物对照实验和安慰剂对照实验的利弊
①比较一个治疗水平t和另一个治疗标准c时选择参考条件,即“治疗标准c”的实质含义
②安慰剂对照实验:药物vs安慰剂
③药物对照实验:药物vs新药物
2、对该部分进行详细讲述:
首先直接说明了评估反事实因果效应的第一个困难:在比较一个治疗水平t和另一个治疗标准c时选择参考条件,即“治疗标准c”的实质含义。随后又阐述了该问题,研究人员可以通过指数治疗的效果将根据什么样的替代条件进行评估进而解决这个问题。
通过举例说明了如何去解决这个问题:例如,在药物治疗试验中,药物治疗的效果通常与安慰剂治疗(安慰剂对照试验)的效果进行对比,因为在大多数情况下,由患者接受治疗的印象产生的效果不是相关的效果。另一方面,如果一种药物已经显示出积极的效果,用这种药物治疗可以用来比较新药的疗效(药物对照试验)---两种实验的效果在理想状态下是不同的。
(5)多重因果因素和因果机制
1、多重因果因素和因果机制:该部分通过例证和图表说明了有关因果机制和因果因素的相关结论
①在反事实模型中,因果因素是一个必要的因素,没有它,结果(如治疗成功)就不会发生
②因果效应不一定是直接效应
③影响的机制与影响修正和中介变量密切相关
④由于不要求条件对结果是充分的,因此允许存在多个因果因素
2、对该部分进行详细讲述:
文章该部分通过与大多数身体疾病和几乎所有精神疾病的病因是多原因的事实一致的例子对结论由于不要求条件对结果是充分的,因此允许存在多个因果因素; 在反事实模型中,因果因素是一个必要的因素,没有它,结果(如治疗成功)就不会发生加强了论证。
随后通过医学中医生和患者治疗之间的关系,充分说明了因果效应不一定是直接效应,通过触发一系列连续事件(生物、生化、心理或社会起源)而导致结果,而这些事件反过来又会影响结果(直接或间接)引出了图1:X通过对Z产生影响进而作用于Y;最后引出了影响的机制与影响修正和中介变量密切相关的结论PS:【调查因果关系并不需要了解其机制。然而,解释关联的能力往往支持其具有因果成分的结论】(这个结论简单点来说就是:
调节剂或者说是中介:
①不受×与丫影响(相对独立又不是完全独立)
②与x对丫的影响效果有关
③受x影响进而产生对丫的影响
二、反事实的统计推断
1、反事实效应的统计推断:通过法医弹道学中的人体模型例子简单证明了该部分的观点以及解决办法引出了平均因果效应
①不存在客观标准来评估单次观察结果
②平均因果效应:需要多次观察,涉及不同的个体或不同的时间点或两者兼而有之。统计上稳定的结论也需要许多观察
2、对该部分进行详细讲述:
该部分通过“法医弹道学中的人体模型”---证明子弹来自一支特定的枪,并在一名死者身上被发现但是不能证明是由于中弹而导致死亡,因为该人可能在子弹射出的那一刻死于突发冠状动脉衰竭,但这种可能性可以通过尸检来证实。举例论证了不存在客观标准来评估单次观察结果,如治疗成功(Yi,t=1)是否是由接受的治疗或其他因素引起的的结论。
进而引出了在缺少这种证实标准的情况下,我们可以通过平均因果效应来评估---平均因果效应:需要多次观察,涉及不同的个体或不同的时间点或两者兼而有之。统计上稳定的结论也需要许多观察
(2)平均因果效应
1、平均因果效应:首先对平均因果效应做出了解释,对要解释为总体平均效应的估计给出了公式上的标准
①平均因果效应,即目标人群中个体因果效应的平均值
②不同偏差的存在和大小取决于目标人群的选择
③要解释为总体平均效应的估计,X=t与X=c的算术平均值之间的差异(各治疗组中所有个体的汇总)必须等于个体水平差异的算术平均数
④随着越来越多的人(在一种或两种情况下)面临结果高风险,汇总优势比的总体平均解释变得越来越错误
2、对该部分进行详细讲述:
文章该部分,首先对平均因果效应做出了解释:平均因果效应,即目标人群中个体因果效应的平均值(目标群体:包括要对其进行推断的所有个体,而实际采样的群体是源群体---理想情况下,源群体等于目标群体,个体从该群体中随机抽样)如果样本来自目标人群以外的其他人群或者源人群中的平均因果效应与目标人群中的不同,则会出现选择偏差。进而引出不同偏差的存在和大小取决于目标人群的选择的结论。
对如果解释为总体平均效应的估计前提做出了公式(必要条件):X=t与X=c的算术平均值之间的差异(各治疗组中所有个体的汇总)必须等于个体水平差异的算术平均数;在次基础上又对汇总和总体平均做出了评价:随着越来越多的人(在一种或两种情况下)面临结果高风险,汇总优势比的总体平均解释变得越来越错误。
以下讨论仅限于由不同个体而不是不同时间点(或两者)组成的样本的更常见情况---这 就现实的一般情况(简单来说就是不同个体在同一时间点之间进行比较或者同一个体在不同时间点进行比较。)
(3)稳定个体的治疗假设
1、稳定个体的治疗假设:首先对稳定单元处理假设做出了说明和解释,最后对因果效应的估计做出了进一步的理解
①:假设个人I的结果独立于其他个人的结果及其接受的治疗水平。这被称为稳定单元处理假设
②:统计角度来看,因果效应的估计可以被视为缺失值的特定问题
2、对该部分进行详细讲述:
文章该部分首先对人群中每个个体的治疗分配结果进行了描述:在分配治疗前,人群中每个个体i都有两个随机变量:治疗c下的结果(Yi,c)和治疗t下的结果--为了简单和方便实验:我现在假设个人I的结果独立于其他个人的结果及其接受的治疗水平。这被称为稳定单元处理假设(它不适用于传染病作为结果。流感是一种特定个体的免疫可能影响其他个体的疾病(称为“群体效应”)
在治疗分配和结果观察之后,对于一个群体来说,每个个体只能包含一种实现结果。故统计角度来看,因果效应的估计可以被视为缺失值的特定问题。
(4)可交换性
1、可交换性:对简单的平均因果效应的估计做出了表示,给出了可以直接估计平均因果效应的必要条件,对其必要条件-可交换性的两个满足条件给出了详细的阐明。
①:最简单的估计方法是两个样本平均值之间的差异
②:如果具有X=c和X=t的个体是“可交换的”,则可以直接估计平均因果效应,因为分配没有偏差
③:对于Yt,接受治疗t的个体是接受治疗c的个体的替代品。
对于Yc,接受治疗c的个体是接受治疗t的个体的替代品。
2、对该部分进行详细讲述:
文章该部分首先做出假设:假设平均因果效应被定义为两个条件X=t和X=c之间目标群体的平均值差异故平均因果效应最简单的估计方法是两个样本平均值之间的差异。又给出了直接估计平均因果效应的必要条件:如果具有X=c和X=t的个体是“可交换的”,则可以直接估计平均因果效应,因为分配没有偏差(理想情况,现实中还是存在一定偏差)。
对可交换性做出了诠释:对于Yt,接受治疗t的个体是接受治疗c的个体的替代品。对于Yc,接受治疗c的个体是接受治疗t的个体的替代品。Ps:统计方法有助于实现因果效应的无偏估计。
一、因果效应的异质性
1、因果效应的异质性:一个重要的问题是评估个体之间因果效应的差异,因子Z作为X对Y影响的修正因子的必要条件是Z先于结果Y,效应修正因子通常用回归模型中的相互作用项进行评估(如果这种潜在影响修正因子Z与X相关,则在不作进一步假设的情况下,无法确定描述X对Y的影响修正的参数)----[回归模型重要的基础或者方法就是回归分析,回归分析是研究一个变量(被解释变量)关于另一个(些)变量(解释变量)的具体依赖关系的计算方法和理论,是建模和分析数据的重要工具。在这里,我们使用曲线/线来拟合这些数据点,在这种方式下,从曲线或线到数据点的距离差异最小。]
(2)效果度量的选择
1、效果度量的选择:对效果度量的意义做出了阐述,对于风险差异也做出了说明通过例子来证明风险差异存在的实际作用,引出因果协同和超加性的概念。
①影响程度的不同取决于Z值的不同
②一些效应测量方法(如几率比)通常只用来量化因果效应的大小,而且认为方法它在个体之间是恒定的
③风险差异是唯一的衡量标准
④效果异质性与反事实效果方面的因果协同作用有逻辑上的联系
⑤超加性风险差异:其中X=1和Z=1的联合效应高于(X=1,Z=0)和(X=0,Z=1)的效应之和,而Y=1在(X=2,Z=2)下的风险
⑥如果存在超可加性,则可以证明X和Z之间在Y上一定存在因果协同作用,至少对某些个体而言是如此
⑦我们可以证明一种因果关系,而不是这种因果关系不存在
⑧因果协同意味着1)如果存在一个或两个因素,Yi=1;2)如果两个因素都不存在,Yi=0。
2、对该部分进行详细讲述:
首先文章该部分通过对因果效应影响程度的不同取决于Z值的不同,进而对测量方法进行说明:一些效应测量方法(如几率比)通常只用来量化因果效应的大小,而且认为方法它在个体之间是恒定的。引出风险差异是影响异质性在反事实影响方面与因果共同作用逻辑上联系的唯一度量。(异质性(Heterogeneity)是指⼀些事物在某些特征上存在差异。在Meta分析中,异质性指纳⼊的不同研究之间存在的差异。异质性是遗传学概念,⼀种遗传性状可以由多个不同的遗传物质改变所引起。)(风险差异(risk difference,RD)(也称为绝对风险缩减量absolute risk reduction,ARR) 预防1例不良事件发生或得到1例有利结果需要治疗的病例数(number needed to treat,NNT))通过例子:第一Yi = 1出现在 Xi = 1 的所有情况下,而在其他情况下不出现;第二 Yi = 1 出现在 Zi = 1 的所有情况下,而在其他情况下不出现。对因果协同做出了解释:因果协同意味着1)如果存在一个或两个因素,Yi=1;2)如果两个因素都不存在,Yi=0。结合现代人们对超加性风险差异感兴趣引出公式 ---P(Y = 1 | X = 1, Z = 1) > P(Y = 1 | X = 1, Z = 0) + P(Y = 1 |X = 0, Z = 1) - P(Y = 1 | X = 0, Z = 0).如果存在超加性,可以证明 X 和 Z 在 Y 上一定存在因果协同作用如果某些个体之间存在因果协同作用,则可能不存在超加性。最后通过例子:”如果已知某种药物的摄入剂量会线性地影响某种激素的释放,那么在线性模型中,另一个因素与药物摄入的交互项就对应着生物交互作用的存在”说明了选择效应指数的另一个关键点:回归模型中的相互作用项是否对应于所谓的基于机制的(如生物)相互作用。
(三)确定性与概率因果关系
1、确定性与概率因果关系:接着上文中的异质性开始展开,因果关系的功能决定论的理解,以及结果Y的准确性,该部分总体来说是对实验中的大部分差异因素做出了说明。
①因果效应异质性相关的一个基本问题是确定性因果关系和概率因果关系之间的区别
②因果关系的功能确定性理解基于拉普拉斯自然现象概念
③在没有测量误差和其他偏见的情况下,Y的可观察异质性--给定X和其他观察到的协变量--将完全归因于未观察到的因素
④结果Y中存在个体差异,这不能用未考虑的因素来解释。这种变化可以称为真实随机性
⑤在实际情况中,确定性因果关系和概率因果关系之间的区别在复杂到足以导致建模中存在大量剩余异质性的系统中并不起主要作用
⑥影响估计的差异并不意味着不同的因果机制起作用;相反,它们可能仅仅是由于隐藏效应修饰剂的不同分布
⑦非可操作属性几乎不受反事实参数的影响。
2、对该部分进行详细讲述:
文章该部分首先对因果效应异质性进行了详细说明:因果效应异质性相关的一个基本问题是确定性因果关系和概率因果关系之间的区别。接着引用了拉普拉斯自然观对因果关系的功能决定论做出了理解,(拉普拉斯:“我们可以把宇宙现在的状态视为其过去的果以及未来的因。如果一个智者能知道某一刻所有自然运动的力和所有自然构成的物件的位置,假如他也能够对这些数据进行分析,那宇宙里最大的物体到最小的粒子的运动都会包含在一条简单公式中。对于这智者来说,没有事物会是含糊的,而未来只会像过去般出现在他面前);在没有测量误差和其他偏见的情况下,Y的可观察异质性--给定X和其他观察到的协变量--将完全归因于未观察到的因素(“协变量:在实验的设计中,协变量是⼀个独⽴变量(解释变量),不为
实验者所操纵,但仍影响实验结果。)之后对于实验中个体间无法区别的差别进行了特别说明:在因果关系的概率理解中,结果Y中存在个体差异,这不能用未考虑的因素来解释。这种变化可以称为真实随机性。进而我们也可以将真实随机性纳入反事实模型中来进行实验,指定固定个体在固定时间的潜在结果的概率分布。本段后部分也说明了即使我们不去做特意的说明和参数的施加:在实际情况中,确定性因果关系和概率因果关系之间的区别在复杂到足以导致建模中存在大量剩余异质性的系统中并不起主要作用。该部分的最后一段直接可以可以逆向理解为效应修正因子的存在,使人们期望相同的效果;影响估计的差异并不意味着不同的因果机制起作用;相反,它们可能仅仅是由于隐藏效应修饰剂的不同分布。对于个体的性别、种族和出生日期等不可变属性通常被视为模型范围狭窄的指标。综上所述,非可操作属性几乎不受反事实参数的影响。
(修正值定义为:⽤代数⽅法与未修正测量结果相加,以补偿其系统误差的值。
修正因⼦定义为:为补偿系统误差⽽与未修正测量结果相乘的数字因⼦。效应修正被定义为暴露因素在各层中与疾病的联系强度(测量的效应)因第三变量的存在情况不同⽽⼤⼩不同)
一、随机和非随机研究中的因果推断(1)--随机实验
1、随机实验:提出倾向得分这个名词,对倾向得分进行详细解释
①倾向评分是个体i被分配到治疗t的概率——用PSi=P(Xi=t)表示。
②倾向得分在X=c或X=t的个体中相等的假设比可交换性假设强,因为倾向得分的决定因素不一定影响结果Y
③如果个体在治疗之间是可交换的,并且没有其他偏差,则可以直接估计因果效应,最简单的方法是用X=c和X=t之间的Y平均值的差异
④PSi = g(zi)函数下可以忽略x的影响称为强忽略性
⑤在给定倾向得分的情况下,可以证明 X 和 Zare 条件独立;也就是说,倾向得分 PS 总
结了 Z 关于组分配 中包含的所有信息
⑥倾向性得分的问题在于,它足以控制,但不是最低限度的充分(它可能包括不必要的信息,因为与Y相关但与X无关的协变量)
2、对该部分进行详细讲述:
该部分首先对交换性假设再次做出了说明:如果个体在治疗之间是可交换的,并且没有其他偏差,则可以直接估计因果效应,最简单的方法是用X=c和X=t之间的Y平均值的差异。进而引出倾向得分这个名词:倾向评分是个体i被分配到治疗t的概率——用PSi=P(Xi=t)表示。将倾向得分和交换性假设做出对比,得出结论:倾向得分在X=c或X=t的个体中相等的假设比可交换性假设强,因为倾向得分的决定因素不一定影响结果Y。通过例子:“将个体分配给每个治疗,概率为50%:PSi=1/2”说明简单的随机实验中,所有个体的PSi都相等(即倾向得分)都相同。接下来提出协变量的重要性,协变量向量Zinto纳入组分配(块设计)。通过假设这些协变量也是结果的因素,考虑它们通常会提高因果效应估计的统计精度,进而提出强忽略性的定义:PSi = g(zi)函数下可以忽略x的影响称为强忽略性。接下来文章该部分对倾向得分再次进行了深刻说明:在给定倾向得分的情况下,可以证明 X 和 Zare 条件独立;也就是说,倾向得分 PS 总结了 Z 关于组分配 中包含的所有信息。通过假设如果实体根据倾向得分成对匹配,如果它们与反向倾向得分成比例加权,或者如果倾向得分在适当的回归模型中进行调整,则可以近似估计X对Y的平均影响,而不会因分配而产生偏差。文章最后提出了贝叶斯的理解:“倾向得分的估计是在Z=z下预测暴露分配(X=t)的后验概率”(先验概率(prior probability):指根据以往经验和分析。在实验或采样前就可以得到的概率。
后验概率(posterior probability):指某件事已经发生,想要计算这件事发生的原因是由某个因素引起的概率。
可以看出,先验概率就是事先可估计的概率分布,而后验概率类似贝叶斯公式“由果溯因”的思想。)也提出了倾向得分的问题:倾向性得分的问题在于,它足以控制,但不是最低限度的充分(它可能包括不必要的信息,因为与Y相关但与X无关的协变量)
(2)不完善的实验
1、不完善的实验:阐述了有关实验过程不是完全理想状态下的情况,对这种不完善的实验进行了解释
①不完美的实验构成了理想顺应性实验和观察研究之间的桥梁
2、对该部分进行详细讲述:
文章该部分首先对我们所做的实验给出了一定的标准假设治疗和控制方案得到了严格遵守,从这个意义上来说,我们的实验就是完善的。接下来从实际的情况进行说明,实际的治疗和控制条件并不等于预期的方案,从这个方面来说我们的实验就是不够完美的,并对此进行举例说明“在使用抗抑郁药物治疗抑郁症的过程中,人们经常面临这样一个问题,即抗抑郁治疗组(X=t)中的许多人停止服药,因为在开始时,他们只会经历不良反应”但是不完美的实验才构成了理想顺应性实验和观察研究之间的桥梁。
(3)工具变量(辅助变量)
1、工具变量(辅助变量):通过意向治疗分析,提出工具变量这个名词,对工具变量做出了许多的说明。
①如果忽略了治疗条件没有完全遵循这一事实,则可以估计预期治疗的效果,而不是实际治疗的效果。这被称为意向治疗分析。
②工具变量I是与实际治疗或暴露X相关的变量,但仅通过其与X的关联与结果Y相关。可能工具变量最重要的例子是预期治疗
③I和X之间的关联必须是已知的或可估计的,I和X之间的差异必须独立于其他变量
2、对该部分进行详细讲述:
文章该部分首先对上文的完善实验提出了相反的假设,提出了意向治疗分析的概念:如果忽略了治疗条件没有完全遵循这一事实,则可以估计预期治疗的效果,而不是实际治疗的效果。又映射出了工具变量:工具变量I是与实际治疗或暴露X相关的变量,但仅通过其与X的关联与结果Y相关。可能工具变量最重要的例子是预期治疗。使用条件1:当观察到的X-Y关联比I-X和I-Y关联更混乱时,这些方法很有用----在特定条件下,根据具体问题的不同,可以根据I-X和I-Y关联计算X-Y关联或其边界。使用条件2:工具变量方法适用的另一种情况是,不能直接观察到X,而只能直接观察到其替代物I。对工具变量的使用做出了以下总结:I和X之间的关联必须是已知的或可估计的,I和X之间的差异必须独立于其他变量。
(4)观察性研究
1、观察性研究:提出观察性研究的概念,对倾向得分做出了进一步的说明,提出了医学中的混杂
①并不是每个有趣的因素都能转化为等效的实验室设置或被操纵,在这种情况下,别无选择,只能进行观察研究
②在观察性研究中,分组既不是操纵的,也不是随机的。
③倾向得分通常取决于各种变量(表示为向量Z)
④在实践中,无法确定某一变量是否为混杂因素,因为这取决于所有(其他)混杂因素和偏差
2、对该部分进行详细讲述:
文章该部分通过无法进行完美的理想实验,提出了观察性研究:并不是每个有趣的因素都能转化为等效的实验室设置或被操纵,在这种情况下,别无选择,只能进行观察研究。观察性研究的特点:在观察性研究中,分组既不是操纵的,也不是随机的。通过吸烟等一些无法直接强加于个体上的特征的例子,证明了我们为什么要使用观察性研究?又对上文中提出倾向得分进行了说明:倾向得分通常取决于各种变量(表示为向量Z),进一步引出了医学中混杂的相关概念,下部分基本都是围绕混杂,混杂因素来进行说明(医学中什么是混杂因素?:在临床研究中,常常存在一些因素(非研究因素),它们与研究因素和研究结局之间存在一定的关联,会使研究真正的因果关系受到影响。这些非研究因素就是我们所谓的“混杂因素”。混杂因素应同时满足下列两个条件:(1)该因素影响研究的阳性结果(如阻止或促进)2)该因素在对比组(暴露组和非暴露组)中的分布不同。)( 以上是关于猿创征文|基于反事实的因果推理Causal inference based on counterfactuals--一万六千字文献详细解读(因果关系的推理应用)全文总结的主要内容,如果未能解决你的问题,请参考以下文章 因果推断与反事实预测——利用DML进行价格弹性计算(二十四) 因果推断与反事实预测——利用DML进行价格弹性计算(二十四)