真实世界研究常用统计分析方法_临床研究_实用技巧

相较于RCT研究，真实世界研究中的统计分析方法主要是因果推断方法，其中特别需要注意对混杂效应的控制或调整，以避免得出有偏倚的效应估计。以下仅对部分常用的因果推断方法做概括性说明，具体的技术细节和使用参见相关文献（不排除其他方法的合理应用）。

一、描述性分析和非调整分析

对于真实世界研究，正确有效的描述性统计分析可以发挥较为重要的作用。例如，在疾病登记队列研究中，按暴露因素的不同水平对相关协变量进行分层描述统计有助于比较组间的均衡性；在倾向评分匹配数据集中，按暴露因素分组汇总统计相关协变量可帮助发现残余不均衡等。真实世界研究通常需要从大量协变量中考虑可能的混杂因素，利用描述性统计分析对受试者的相关特征进行广泛和全面的探索性分析是非常必要的。

二、调整分析

（一）协变量的选择

对于采用调整协变量的因果推断方法，协变量选择方法大致分为两类，一类是基于暴露至结局相关路径构成的因果关系网络，识别出风险因子、混杂因素、中间变量（Intermediate Variable）、时变型混杂因素（Time-varying Confounder）、碰撞节点变量（Collider Variable）及工具变量（InstrumentalVariable），将风险因子和混杂因素作为协变量纳入模型，同时避免纳入中间变量、碰撞节点变量和工具变量，但对于时变型治疗或混杂等复杂情况，可能需要调整中间变量和碰撞节点变量，对此额外引入的偏倚，应注意采用合理的统计分析方法同时进行控制。在实际应用中，当部分因果结构已知时，协变量的选择方法可以基于相关疾病和治疗领域的背景知识，对所有观测到的、可能与结局相关的基线变量，已知的结局相关危险因素，以及治疗或结局的所有直接起因变量，都进行调整。另一类协变量选择方法是基于高维自动变量选择的方法，从数据中经验的学习变量间的相关关系，筛选出与处理因素和/或结局变量相关的变量作为协变量。上述两类方法可以结合使用，即首先利用专业经验知识，确定一个变量集合，然后使用适宜的经验学习方法，从中筛选出纳入最终分析模型的协变量。这样做的优点是限制了对经验学习的依赖性，在减小混杂效应的同时也减小了过度调整的风险。需注意的是，协变量的选择过程必须是公开、透明的。

（二）利用回归模型进行调整分析

利用各类回归模型对潜在混杂因素进行调整，从而估计药物暴露的效应，一般调整的变量可能同时与研究的处理因素和结局指标相关，且在因果路径上位于处理因素之前。回归模型的选择应考虑：模型的假设是否成立，自变量的选择是否恰当，是否需要利用汇总的协变量（如PS或疾病风险评分），暴露变量和反应变量（结局事件）的发生率等。

（三）倾向评分

倾向评分定义为在观察到的协变量条件下，观察对象接受某种处理（或暴露）的概率，可以综合概括所有已观测到的协变量的组间均衡性。对基于这些协变量的倾向评分进行调整，可以有效地控制混杂效应，是一种在有较多协变量的情况下对混杂效应的调整方法。通常可采用倾向评分匹配法（Propensity-score Matching），倾向评分分层法（Stratification / Subclassification），逆概率加权法（Inverse Probability of Treatment Weighting，IPTW），以及将倾向评分作为唯一协变量纳入统计模型进行调整分析等方法进行因果效应估计。

利用倾向评分进行因果效应估计时，需要判断倾向评分接近的患者在不同组间的协变量分布是否均衡、不同组间倾向评分分布的重合性如何。对于重合性不好的情况可以考虑补救方案，如限制研究对象范围为各组倾向评分分布的重叠区域，但应注意由此引发的目标人群变化可能导致因果效应估计结果不适用于原始目标人群。需注意的是，倾向评分匹配方法只能对已知的观测到的协变量进行调整，对未知或未观测到的协变量需要借助敏感性分析进行评价。另外，传统回归方法与倾向评分匹配法各有利弊，前者不能保证研究协变量一定均衡，后者可能会导致样本量减少，因此进一步的敏感性分析是非常必要的。

（四）疾病风险评分（DiseaseRisk Score，DRS）

疾病风险评分与倾向评分作用相似，是一个基于所有协变量的综合指标，定义为假定无暴露和特定协变量条件下，发生结局事件的概率。估计DRS的方法一般分为两类：一类是利用研究样本的所有观测值进行拟合，将暴露（设值为无暴露）与协变量作为自变量，研究结局作为因变量得到相应的DRS预测值；另一类是仅利用无暴露的样本估计DRS，然后将所有研究样本的协变量取值回代入DRS模型，对所有研究样本计算相应的DRS预测值。

对于结局事件常见但处理（暴露）因素罕见、或者可能存在多重暴露的研究，DRS方法是一种较好的选择，能够平衡不同组间样本的基线疾病风险。对于处理（暴露）因素多水平，且部分水平较罕见的情况，建议选择DRS方法而非PS方法。

（五）工具变量

上述传统多元回归、倾向评分和疾病风险评分等方法只能控制已测混杂，对未知或无法测量的混杂因素无法调整。工具变量能够控制未观测到的混杂因素，进而估计出处理与结局的因果效应，不涉及具体地对混杂因素/协变量的调整。如果某变量与处理因素相关，并且对结局变量的影响只能通过影响处理因素实现，同时与暴露和结局的混杂因素不相关，那么该变量可以称为一个工具变量。

使用工具变量最大的难点在于找到合适的工具变量。首先，工具变量必须与暴露和结局的所有观测到或未观测到的混杂因素不相关。其次，工具变量对结局不能有直接影响，除非通过处理至结局的通路间接作用于结局。最后，工具变量必须与研究的处理因素相关，而且相关性越高越好。可采用二阶段最小二乘估计等方法利用工具变量进行因果效应估计。

四、缺失数据考虑

缺失数据在真实世界研究中通常难以避免，不仅结局变量可能缺失，协变量也有可能缺失。研究者和申办方应考虑优化试验设计，尽可能地将缺失率降到最低。

在进行主要分析前，应先尝试分析数据缺失的原因。通常缺失数据按缺失机制可以分为三种情况：完全随机缺失（Missing Completely At Random，MCAR）、随机缺失（Missing At Random，MAR）和非随机缺失（Missing Not At Random，MNAR）。完全随机缺失指数据缺失的概率与所有已测或未测的协变量及结局变量均无关。随机缺失指在给定的已测协变量取值和结局变量条件下，数据是否缺失是随机的，与潜在结局无关。而非随机缺失指数据的缺失概率与缺失值本身有关，同时也可能与已测协变量及结局变量有关。

对于缺失数据，选择正确的方法进行填补和分析是避免偏倚和信息损失的有效手段，否则会因剔除缺失数据而导致样本量减少、降低研究效率。恰当的填补方法应根据缺失机制和临床问题建立相应的假设来确定。一般来说，对于完全随机缺失，可以只对数据完整的样本进行分析；对于随机缺失，可以构建统计模型进行预测填补，例如多重填补（Multiple Imputation，MI）、传统回归模型方法、马尔科夫链蒙特卡洛（Markov Chain Monte Carlo，MCMC）方法、全条件定义法（Fully Conditional Specification，FCS）等；对于非随机缺失，可利用模式混合模型（Pattern Mixture Models，PMM）方法，分别对缺失数据和非缺失数据构建不同的统计模型进行分析。此外，还有单一值填补方法，其优点是原理简单、易于操作，缺点是即使在随机缺失条件下也不能保证结果正确有效，且没有考虑缺失值的变异性，因此一般不建议用于主要分析。

在可能有协变量缺失的观察性研究中，对不同缺失模式可考虑使用一些常规统计方法，包括完整数据分析法、多重填补法和倾向评分法。

需要明确的是，三种数据缺失机制假设通常均无法直接检测，只能通过对数据收集过程的描述和理解来说明其合理性。现实中，难以确定最佳的或唯一适用的缺失数据处理方法，也没有任何方法可以得到与原始完整数据一样的稳健无偏估计。应对缺失数据的最佳策略，关键在于研究的合理设计和实施。

五、敏感性分析和偏倚的定量分析

上述各种因果推断方法均有各自的适用条件和假设，例如未观测协变量的可交换性、一致性和正相关性，因此需要针对这些假设进行敏感性分析，以期对因果推断结果的稳健性进行评价。例如，两个基线协变量相同的患者，其未观测的协变量可能会导致接受治疗的概率完全不同。敏感性分析可以检测未观测的协变量对疗效估计偏倚的影响，协助确定基于接受治疗概率而估计的疗效的上下限。

关于偏倚的定量分析，应保证分析过程透明、可信，一般采用以下步骤：①结合因果结构模型和观测数据，以鉴别可能的偏倚；②利用含有假设的因果图计算偏倚的大小及其对因果效应解释的影响；③结合研究目的和偏倚模型，利用偏倚参数的分布来评价偏倚的大小和不确定性。

最后需要特别说明的是，对于分析结果的解释，真实世界研究与其它确证性研究一样，应尽可能全面、客观、准确、充分，不能仅仅强调统计学意义（如P值和置信区间），更要注重临床实际意义；不仅要看最终的结论，还要看形成该结论的整个证据链的逻辑性和完整性；不仅要看整体结论，也要关注亚组效应；不仅要控制已测或可测的混杂因素，还需控制潜在未测或不可测混杂因素（如采用历史事件率比进行调整）；此外，对各种可能偏倚和混杂的控制和影响需要给予尽可能详尽的阐述。

来源：http://www.nmpa.gov.cn/WS04/CL2138/373175.html

科研星球

真实世界研究常用统计分析方法

标签