流行病学中阴性对照方法简述

时间:2022-10-26 09:01:09   热度:37.1℃   作者:网络

对观察性研究进行因果推断时,往往需要考虑到未知混杂因素的存在。为了排除未知混杂对推断结果产生的可能影响,常常使用辅助变量来帮助识别因果作用和消除混杂偏倚(如工具变量、阴性对照)。今天要介绍的阴性对照方法,就是一种用于检测与矫正未知混杂的常见方法。

流行病学研究最初使用阴性对照方法来检测研究中是否还存在可能影响结果的未知因素。其原理是“阴性对照实验检测的结果必须是阴性”。

用一个简单的例子来说明阴性对照的基本思想:

图片

此处的暴露因素(A)为流感疫苗接种,结局(Y)为流感住院情况。在我们想要研究流感疫苗接种是否能够有效降低流感住院率时,除了已经测量到的混杂因素,还应该考虑到研究中是否仍然存在未被测量到的混杂因素?如果研究中仍然存在混杂因素,那么得到的因果解释将不那么让人信服。 

假设患者的求医行为(U)是无法测量的混杂因素,积极求医的行为会增加患者接种流感疫苗的几率,也会增加其流感入院率。同时我们找到了另外一个变量—车祸/受伤入院情况(W),这个变量也同样受到求医行为的影响,可以称之为A和W与A和Y共享同样的偏倚结构。

但明显,患者接种流感疫苗与否,并不会改变其因车祸/受伤的住院情况。如果这两个变量之间产生了某种关联,那我们可以得出判断:A与Y之间存在未测量的混杂因素。

同理,我们也可以试图找到一个暴露变量,例如年度健康访问记录,对其与结局变量做关联分析,借以判断是否存在未测混杂。

在本例中出现的两个变量,即年度健康访问记录与车祸/受伤入院情况,分别可以称之为阴性对照暴露变量(NCE)和阴性对照结局变量(NCO)。它们不是研究真正感兴趣的暴露和结局变量,只是作为辅助变量出现来帮助检测和控制偏倚。它们都与未知混杂U有关,但是却与首要的结局(暴露)无关。

综上所述,阴性对照暴露变量和结局变量的定义可以用数学语言这样表达:

图片

除了要求阴性对照变量Z、W与暴露或结局变量不能有直接的因果关系之外,上述的定义也要求Z与(W,Y)之间的混杂因素与X与(W,Y)之间的混杂相同,即共享同样的偏倚结构。但是在实际研究中,一般难以获知偏倚结构的相同与否,所以一般选择同一时期、同一经历等获取变量作为阴性对照。

下列给出一些文献常见的阴性对照变量选择作为参考:

图片

在母体暴露对子代结局的研究中,常使用父体暴露作为NCE,以排除父母基因/疾病的未知混杂。在研究空气污染对疾病结局时,未来时间的空气暴露/别处的空气暴露常作为NCE,这种采用时间/空间约束的策略能使变量的选择更加符合假定。另一种策略是选择与主要结局相似的结局作为NCO,但从先验知识中可以得知NCO与先验暴露无关(如为了评估空气污染对哮喘引起的住院的影响,[55]将阑尾炎引起的住院定义为NCO)。

值得提醒的是,尽管文献中有多种策略来寻找候选阴性对照,但研究者应严格验证阴性对照的选择,并注意可能违反阴性对照假设的情况。在实践中,我们建议检查以下标准以找到候选阴性对照变量:

1.阴性对照暴露(结局)变量应当与关心的结局(暴露)变量无关

2.阴性对照变量的未知混杂机制应与A和Y的混杂机制相同

3.应该确保足够的阴性对照power

在第一个例子中,我们已经给出了检测是否存在未知偏倚的常用方法,即检查NCE或NCO与主要结局或暴露是否存在关联。在流行病学和生物统计学中,阴性对照方法也常用于矫正偏倚以识别真正的因果作用,但这些方法通常需要很强的模型假定。在空气污染研究中,当前和未来的污染物水平通常呈正相关,并且与同一方向上的未测混杂相关。在这种情况下,[33]表明在结果模型中纳入未来的空气污染(NCE)可以减少混杂偏倚。在[49]中,通过结合过去和将来的暴露,提出了进一步的偏倚减方法。

下面为读者简单介绍一个使用双阴性对照变量非参数识别因果作用的方法。

(混杂桥函数)假定存在一个函数图片 ,对所有图片 ,都有图片

混杂桥函数描述的是混杂因素对关心的结果变量与对阴性对照结果的作用之间的关系。

在潜在可忽略性的假设下,我们可以把该函数写为图片 的形式。

可见,潜在结果的均值可以用阴性对照结果的分布表示出来。此时如果知道图片 函数,那么图片 就可以被识别,进而识别因果作用。在通过引入阴性对照暴露变量,可以得到:

图片 

由于该式中只涉及观测数据的分布和未知混杂桥函数图片 ,再结合完备性条件,就可以识别图片 和平均因果作用。

总结:

阴性对照是观察性研究中创新的重要工具。阴性对照方法的发展将鼓励研究人员定期检查混杂偏倚的证据,并严格调整剩余混杂偏倚。阴性对照变量可以广泛使用在定期收集的医疗数据(如行政索赔和电子健康记录数据),因为在首要暴露与结果之外往往还记录了一些辅助治疗手段或者次要结果,这些都可以作为阴性对照变量。因此,开发阴性对照方法对于充分挖掘当代医疗保健数据的潜力并最终提高研究结果的有效性至关重要。

参考文献:

Shi, X., Miao, W. & Tchetgen, E.T. A Selective Review of Negative Control Methods in Epidemiology. Curr Epidemiol Rep (2020). https://doi.org/10.1007/s40471-020-00243-4

苗旺, 刘春辰, 耿直. 因果推断的统计方法[J]. 中国科学:数学, 2018, 048(012):P.1753-1778.

上一篇: 因果推断——现代统计的思想飞跃

下一篇: 一文带你读懂-竞争风险模型


 本站广告