科研星球

《JAMA》杂志高度凝练的统计学指南,告诉你如何分析临床大数据

 本文是《JAMA 》杂志子刊"JAMA外科学"的统计学编辑于2018年一篇统计学指南文章,个人对其进行了翻译和修改,来帮助大家理解临床大数据的统计分析思维。


0.png


随着行政数据库和患者登记注册数据库的有如雨后春笋般地出现,研究人员越来越容易获得大数据。这些数据集的大样本量使对罕见结果的研究更加容易,并提供了确定国家估算值和地区差异的潜力。因此,JAMA外科编辑和审稿人已经收到使用大数据去试图回答临床和政策相关问题的稿件。但是,没有数据库完全没有偏倚和测量误差的。对于更大的数据,一些随机现象也可能产生统计学差异的结果,并且由于窄的置信区间,统计推断也可能产生一个精确但是不准确的结果。上述问题在所有临床研究都会遇到,但是在大样本、复杂数据库中,这些方法学的问题将被放大。
关于研究人群的注意事项
对读者而言,重要的是要了解研究者是如何得到研究人群。通常,它根据纳入标准从一个非常庞大的源来源人群筛选得到。统计报告时,应当清楚地描述纳入和排除参与者的流程图,其中要写出包括排除的人数和排除原因。同样,如果研究是纵向研究,应报告失访现象和失访人数,这样有助于读者理解该研究可能存在着选择偏倚。
 
关于研究方法和样本量注意事项
研究的目的和结局指标应在数据收集和分析之前确定。如果作者正在寻找两组人群之间某些变量的差异,则该差异及其置信区间的统计分析也应预先计划。除了统计结果(例如回归系数,P值)外,效应值的差异应报告以患者为中心、具有临床意义且可解释的差异。不幸的是,在没有预先计划的情况下挖掘大型数据集会导致无意的、常常是错误的结论。统计学差异(P值)与样本量有关,并且如果样本量足够大,则各组之间的即使差异很小,也会显示统计学上的差异来(P<0.05),然而这些差异很可能在临床上没有意义。

在报告观察性研究结果时,作者应考虑遵循《加强流行病学观察性研究报告》(STROBE)报告指南。研究设计应清晰描述,并与真实的数据收集和分析方法保持一致,研究结果应以简洁而完整的方式呈现。论文必须说明:该研究是在机构审查委员会批准或获得豁免后进行的。作者还应说明是否进行了任何期中分析以及是否存在这违反研究方案的情况。报告应报告研究的局限性以进一步推动结论的结论科学完整性和有效性观察性研究的解释应仅导致变量之间的关联的描述,而不是因果关系的结论。

尽管对于大型数据库而言,检验效能(Power)不足的现象似乎不太会发生,但事实并非如此。很多罕见结局研究仍然会面临着样本量不足的窘境。因此,无论数据库的大小如何,都应该在研究设计时计算下样本量或者检验效能。当研究结果是阴性,也就是无统计学差异(P>0.05)时,检验效能的分析对对解释研究结果特别有帮助。因此如果该研究开展了事后亚组分析或者检验效能分析,则应在结果文章的方法部分中进行说明。统计分析还应考虑多重比较的问题,尤其是在没有预先计划的情况下。如果一项研究同时进行了20次统计学检验,哪怕是组间的差异是随机产生的,那么也非常可能将有至少一项结果将具有统计学意义(由于一类错误等于5%)。因此,当一项研究统计检验的数量超过20次时(原文如此),采用校正方法(例如Bonferroni校正发,Hochberg顺序法)过程来控制一类错误。
 
关于结果的呈现方式
作者应提供足够详细的分析结果数据,以使读者可以计算和重复结果。与其简单地报告汇总数据或比例,作者不如提供高颗粒度的统计分析结果。作者应该清楚地描述论文中结果和相应变量的缺失情况。当缺失数据的比例很大(> 30%)时,作者应描述数据缺失模式(或者缺失机制),并应考虑使用多重插补等技术进行填补。如果不进行缺失数据填补,仅分析包含完整信息的研究对象时,参结果除了会降低检验效能外,也会导致偏倚产生(选择偏倚)。例如,如果没有医疗保险但患病的人更有可能缺少收入数据,那么分析社会经济状况对手术结局的影响可能会存在问题。
 
考虑到注册登记研究属于观察性研究,一个建议是可以要绘制有向无环图,这将使读者了解潜在的混杂因素和中间变量的作用。如果统计结果包含大量表格,那么除了在正文呈现主要研究结果之外,则应考虑在线提交各种其他结果的附件。如果统计分析结果可以在表格或图中描绘,则无需在手稿的文字再描述一番。饼图和条形图对文本中陈述的内容几乎没有额外信息上的帮助,除非是多个数据和图形的复杂组合。如果要使用条形图,则还应标出95CI工型线。
 
如果研究使用了病历摘要数据,则应详细记录病历数据审查的方法,比如病历数据摘录者是谁、他们的背景、如何接受培训以及是否有标准化的数据收集工具。理想情况下,病历摘录者应不了解研究假设和目标,并且至少应有2个独立的病历数据摘录者,数据分析时,应分析摘录者评分者信度(例如Kappa,也就是说不同摘录者的结果一致性)。
 
统计分析的注意事项
由于基于大数据集的数据分析一般都是观察性的,因此,应较少强调统计假设检验和P值的报告。根据美国统计协会建议,对效果估计值(ORRR值等)的描述和95CI比报告P值更具信息性。如果要比较两组人群的连续变量(例如手术时间,住院时间),则应报告平均差异(或中位数,如果数据不是正态分布的话)及其95CI
 
构建多变量模型(主要是回归模型)时,应描述模型的理论基础。模型的类型(例如logistic模型,线性模型,泊松模型)和基于模型的假设应该明确(例如,模型假设数据的分布呈线性或正态性)。作者应证明没有违反模型假设,如此才能支持模型的有效性。此外,应明确说明选择了哪些预测变量以及为什么为什么这些变量。理想情况下,统计建模不应简单地使用“是否具有统计意义”的标准来选择具有其预测效应的模型。相反,应基于历史文献和/或生物学和临床的合理性选择预测变量。如果仅基于统计意义进行模型构建,这个模型应该认定为探索性的而非确凿性的。多变量logistic回归分析的样本量计算方面,每增加一个预测变量,就应至少增加1015名具有研究者感兴趣的结果的参与者(即阳性事件)。因此,如果研究样本中有20例死亡,则最多只能拥有2个变量作为预测变量,例如多变量模型中的年龄和糖尿病。
 
多变量建模中的另一个考虑因素是参与者内部存在着相关性的可能性(数据不独立、存在着聚集性)。例如,如果正在评估疝修补术后的术后伤口感染的地区差异,那么很可能一名外科医生的不同患者结果具有相关性。在这种情况下,应使用使用广义估计方程分析(可用于非独立性数据的分析)。同样,如果一项研究正在评估同一位患者随时间变化的重复测量结果(例如,手术后3个月和9个月的生活质量评分),则应使用混合模型方法。最后,介绍模型时,作者应描述他们如何评估模型拟合,如何处理多重共线性和校正效果。
 
结论
大型数据集具有许多独特的优势,包括广泛的代表性,有效的采样设计以及数据结构中的一致性。但是,大数据集并非没有偏倚和测量误差,因此重要的是要尊重和承认数据的局限性。因此,大数据面临的挑战是,它需要一个经过深思熟虑且贯穿始终中的研究问题和一个透明的分析策略。所得的文章应提供足够的信息,表明已使用适当的设计和统计方法。当然,信息量和期刊空间限制之间需要保持平衡;因此,如果需要,可以将相关的方法学信息放入补充资料中。

参考文献
Kaji A H , Rademaker A W , Hyslop T . Tips for Analyzing Large Data Sets From the JAMA Surgery Statistical Editors[J]. JAMA SURGERY, 2018, 153(6).

没有账号?