科研星球

医学论文撰写:方法学和结果部分的注意事项

高质量的统计方法和结果报告对于审稿人员和读者评估研究的质量和可靠性至关重要。为了更好的帮助研究人员,梅奥医学中心健康科学研究系的Fang-Shu Ou教授在《Journal of Thoracic Oncology》(IF:13.357)发表了一篇文章,题为《Guidelines for Statistical Reporting in Medical Journals》,旨在提高研究人员对统计方法和结果报告的清晰度,使统计报告更加规范化和标准化,也可以帮助读者加深对于研究实施和分析结果的理解。

 

一、方法学部分

撰写方法学部分的一个原则就是,对于统计分析方法的描述应足够详细,从而使能够访问原始数据的读者判断其是否适用于本研究,并可以验证报告的结果。


为了达到这个目标,要首先描述研究的统计学设计,包括研究目的、研究人群或患者的选择。临床试验设计的参数:如I类错误(包括单侧或双侧检验的选择)、研究把握度、主要终点、效应大小等,这些参数可以使读者判断样本量的有效性,以及所需要的事件数量。


还有一些其他的信息,如随机方案、计划的中期分析、主要终点和分析方法(包括研究人群的定义)也是必需的。对于观察性研究,应该说明该研究的设计是用于检验假设还是产生假设。通常情况下,应该在进行统计分析之前就确定统计分析计划。统计分析计划应包括所设定的假设检验水平,当P值低于该阈值时可以提示具有统计学显著性。此外,还应明确在进行多重比较时,是否要对p值进行校正,以及校正的方法。


缺失数据的处理方法也应该具体描述。如果是以数据驱动来进行变量选择,则应该说明所采用的方法,以及在每一步过程中所需的详细信息。例如,在变量选择过程中最初使用的变量,在逐步筛选中设定的p值,或者是在机器学习方法中选择调整的参数。对于贝叶斯分析或更加复杂的统计分析方法,更应该提供足够详细的信息,可以以附录的形式提供,以便感兴趣的读者可以充分了解研究所用的方法。


最后,统计分析软件和版本也应包括在内,因为它们可能使用不同的优化程序,使得产生的结果会略有不同。对于临床试验,如果期刊要求,还应列出临床试验编号,以及试验方案。

 

二、结果部分

1、患者特征表

结果部分中的第一个表格通常总结了研究人群的基线特征。如果研究中只有一组患者,此表就只有一个数据汇总列。但是,如果研究的主要目的是在已确定的组别之间进行比较,则每一组都应该有单独的一列。


每个患者基线变量的测量值为一行。基线表格通常应包括所有用于定义研究人员的关键基线指标,例如人口统计学、共患病、疾病既往史、疾病特征以及与主要结局相关的预后指标


连续性变量用均值和标准差表示,如果呈现偏态分布,建议使用中位数和四分位间距(下四分位数到上四分位数)或极差(最小值到最大值)表示。


分类指标采用频数和百分比表示。如果存在缺失,不管是连续变量还是分类变量,都应该记录具有缺失数据的患者数量。当缺失数量可以忽略不计时,缺失类别的百分比可以不需要计算,在计算百分比时,分母也不用包含缺失的人数。


如果患者被随机分组,在进行比较时,p值不应包含在用于比较患者组间差异的基线特征表中,因为任何组间观察到的差异都被随机化了。但是,如果研究是一项观察性研究,组间各个变量比较对应的p值则应在基线特征表中列出。


如果数据是随机化患者的一个子集,例如在进行生活质量或生物标记物亚组分析时,仅纳入了同意进行亚组研究的患者,此时随机化不再有效,也不能假设各组之间的差异是因为偶然误差。如果子集人群数量小于最初随机化患者总数的90%,则建议在患者特征表中提供对应的p值。

 

2、p值

p值是在零假设成立的条件下,获得一个至少与观察到的结果一样极端的结果的概率。通常,较小的p值意味着研究中发现的差异不大可能只是因为偶然。报告结果时,组间差异的大小应与p值一起报告


组间的差异应使用点估计值(例如,均值或率的绝对差异,OR值,或HR值)和置信区间(CI)。应报告精确的p值,而不是仅说明它是低于显著性水平或不显著。


通常,当p大于0.01时,可以报告2位小数,当p小于0.01时,应报告3位小数,如果p值很小,则可以将其报告为p<0.001。对于全基因组关联研究或其他高维数据分析得出的p值,应遵循这些研究具体的指南要求。


通常应报告双侧p值,除非研究设计明确假设为单侧p值。建议在进行次要分析和亚组分析,应首选点估计值和CI,而非p值。最后需要注意的是,如果存在预先指定的显著性水平,则结果在统计上要么显著,要么不显著。趋势一词只能用于数据趋势的统计检验,而不能用于描述接近于预先规定的显著性水平的p值。

 

3、分类结局

分类结局,例如对治疗的反应和不良事件的发生,在临床研究中很常见,分类结局通常采用频率和百分比进行描述。CI应跟随点估计值一起报告。清楚地说明用于估计的分母是很重要的。当所有分类结局的分母相同时,只要说明一次分母并阐明它用于所有后续结果就足够了,否则,在计算每个结局的估计值时,指定分母是很有必要的。


当报告不同组别患者分类结局的比较时,请说明使用的统计检验方法,例如卡方检验、Fisher精确检验或Z检验。对于所有的百分比,最好使用相同的小数位数。建议当分母大于200时,可报告小数点后一位小数。

 

4、森林图是呈现亚组分析的好方法

森林图是一种常见的图示方法,可以一眼说明所有感兴趣的亚组的处理效果。信息丰富的森林图应包括点估计值、CI和每个分组的样本大小(包括事件数量),以便读者判断估计的准确性。


当试验不能检验亚组中的治疗效应时,则不建议在森林图中包含亚组的p值。另一种反对的做法是,在亚组分析的森林图的交互检验中包含p值。


区分亚组分析和交互检验很重要的,交互检验是一种常用的统计检验方法,用于评估治疗效果受到患者其他特征(感兴趣的因素)的影响。交互作用通过回归模型进行检验,该模型中包含了治疗方式、感兴趣的因素,以及两个变量之间的交互项。这与亚组分析相反,亚组分析是对每个亚组患者分别单独评估治疗效果,每次评估一组,因此无法比较亚组患者之间的治疗效果。

 

5、生存分析

总生存率是临床研究中常用的结局,用于判断新治疗方法的有效性或基线因素对预后的影响效果。生存数据由两部分组成,需要明确定义。第一个组成部分是从起始时间到死亡或最后一次随访的时间间隔。第二个组成部分是患者在最后一次随访时间点是否死亡或存活。


生存数据可以用多种方式进行展示。Kaplan-Meier曲线是生存数据最常见的图示方式。另一个经常与生存数据一起报告的指标是研究中患者生存的中位时间。中位生存时间可以使用Kaplan-Meier进行估计,这种方法比直接计算中位生存时间更适宜。


0.png

 

表. 绘制Kaplan-Meier曲线时应考虑的注意事项

0 (1).png


三、结论和统计结果解释部分

1、p值大于0.05并不意味着相等

如果p值没有统计学意义,只能得出组间没有观察到差异的结论。无统计显著性的p值不能支持两组相似的结论,只有当研究设计为等效性研究时,才能得出该结论。


2、观察研究:讨论潜在偏倚和未测量的混杂因素

从观察性研究中得出结论时更需要谨慎。当反映关联性的p值具有统计学意义时,单一的观察性研究不足以建立因果关系或说明某一变量影响结局。


假设两组在所有其他因素上都是相同的,p值仅用于衡量差异是由偶然因素造成的可能性。如果由于偏倚和未测量的混杂因素,两组之间存在不平衡,这可能会影响p值。例如,p值可能具有统计显著性,因为与潜在混杂因素相关的组之间存在差异,即使组本身与结局无关。


因此,对于观察性研究设计,观察到的具有统计学意义的组间关联或差异可以反映以下情况:(1)真实的差异或关联(2)潜在的偏倚和未测量的混杂因素,或(1)和(2)的组合,研究结论需要正确反映这一点。


文章来源:医咖会


没有账号?