科研星球

关于Meta分析的10大疑问和解答

本文整理自欧洲心脏病杂志(EHJ)的一篇专家评论“Cardiovascular meta-analyses: fool’s gold or gold for fools?”[1]

在医学领域,短时间内发表许多范围和主题相似的临床研究已是常态,问题来了,哪些试验的结论更可信呢:所有试验?样本量最大的?研究者发起或者政府资助的试验?方法学质量更高的试验?

低质量研究最多只能起到描述性作用;对于随机试验,如果正确实施了随机化,预先确定好样本量和统计分析计划,明确客观终点,缺失数据尽可能少,通常被认为是可信的。然而,即使是随机试验,针对一个特定的临床问题,在几年内也可能会有多个试验发表。此时,Meta分析就能发挥作用。

近几十年来,随着在线文献搜索(如PubMed)的出现,以及对用户友好的统计工具普及(下图),Meta分析取得重大进展。但随之而来又是Meta分析的过度生产和传播,有人也提出疑问:Meta分析还有用吗?

0 (2).png


要回答这个问题,有几个方面的考虑。在阅读Meta分析或对其进行评论时,可以使用一个简单的路线图。

首先,Meta分析应该具备一个有意义的目的第二研究注册(如PROSPERO)是关键前提;第三,报告应该透明,符合报告规范(如PRISMA)要求;第四,Meta分析一般应从同质化研究中检索、选择和提取数据(例如,干预性Meta分析选择随机试验而不是观察性研究;诊断性荟萃分析选择诊断准确性的研究),此外,终点应明确定义。

0.png


Meta分析的10个常见问题

1、在PubMed上检索一个主题时,我发现了同一主题的两篇Meta分析结果相互矛盾。我应该相信哪一个?

在选择了不同研究方法的情况下(如终点定义,效应估计和汇总方法),可能会出现相互矛盾的结果,但通常来讲,最大和最新的Meta分析可能更具代表性和可信度,除非该Meta分析纳入了低质量试验或不相关试验

2、Meta分析主要结果显示有统计学意义(例如P=0.047),但我不确定其对临床的影响,我怎样才能将其用于临床决策?

Meta分析应该最好呈现几个终点,并为读者提供多维视角。例如,仅报告全因死亡是不够的,还应提供发病率和生活质量的结局,以便衡量特定治疗策略的风险、获益和耐受情况。

有意义的P值并不能量化临床影响,还应考虑效应值(如RR、OR、HR),并辅以风险差异(RD)、需治疗数量(NNT)等指标。一个实用的方法是检查对照组和试验组的绝对事件发生率,例如8% vs 20%的事件发生率(RD为12%)、8% vs 10%的事件发生率(RD为2%),虽然两者的P值一样,但前者更具临床意义(图A)。

0 (1).png

3、当我看到某个Meta分析时,什么情况下能很快判断其是可信和有临床意义的?

最好情况是包含一些大型且结果一致的试验,且都有利于干预措施。如果只有一个大型试验,那么大多数小型研究应该在图形上(例如森林图)和分析上与大型试验结果一致。

4、Meta分析纳入的一项大型试验无统计学意义,但许多小型试验显示有统计学意义,我应该相信这个Meta分析的结果吗?

这个问题比较棘手,涉及到研究效应(small-study effects)和发表偏倚的概念。事实上,一些大型试验即使无统计学意义,也会被发表出来;相反,小型试验如果得出了极端结果,也会被有选择地发表。在这种情况下,我们希望小型研究是以对称的方式出现(既有倾向治疗的小型研究,同时还有一些不利于治疗的小型研究)。如果存在显著的不对称性(无论是在图形视觉上还是回归检测中),总效应估计值就不能完全信任(图B)。

0 (4).png


5、患者个体水平(patient-level)的Meta分析是否比研究水平(study level)的Meta分析更可靠?

大多数Meta分析都是从已发表研究中提取数据进行事后汇总,即在研究水平进行汇总和分析。这限制了重复检查数据、使用统一定义以及应用患者个体水平统计模型的可能(如亚组分析、至事件发生时间或复合终点计算),但进行患者水平的Meta分析更耗费时间和资源。我们建议尽量去精读患者个体水平的Meta分析,可能还要辅以最新且全面的研究水平的Meta分析。

6、随机效应和固定效应模型的区别是什么?

Meta分析的核心在于对一些试验的效应估计值进行加权平均。平均值是加权的,即小型试验对效应值的影响比大型试验小。加权可以有几种不同方式,大多数情况下,加权算法是基于包含固定效应或随机效应的数学公式,因此,两种模型用到的具体计算公式不一样,有兴趣的读者可以查看一些针对此问题的文献[2]

随机效应模型在计算中多一个随机误差项,因此会对较小的研究进行更多的权衡,提供更大的置信区间。最好的情况下,随机效应和固定效应模型的结果应该是一致的(图C)[3]

0 (3).png

图. 随机效应与固定效应模型进行Meta分析的结果不一致

7、基于贝叶斯(Bayesian)的Meta分析比频率学框架(frequentist)更好吗?

大多数发表的Meta分析,使用的是频率学理论的分析框架,假设检验生成95%置信区间和P值。偶尔会有人使用贝叶斯方法,要么是贝叶斯方法学专家,要么是频率学框架不能提供有效的分析。使用贝叶斯方法,不会提供P值,可以直接计算概率分布。同样,最好的情况是两种方法得出的结果是一致的。


8、成对Meta分析和网状Meta分析,谁更准确和可靠?

网状Meta分析通常被认为更全面,能够同时检验直接和间接效应估计。然而,即使是进行简单的网状Meta分析,也必须做出许多假设,因此,即使包括相似的试验集,得出的结论也可能不同。因此,采用直接证据的成对Meta分析通常更具有内部有效性(也被一些指南编写委员会认为是最高水平的证据)。当成对Meta分析无法得出结论,即缺乏直接比较的证据,或者有好几种可供选择的治疗方法,单一的成对Meta分析不能确定性提供决策信息时,此时,网状Meta分析尤其有用。

9、从哪儿找到可信的Meta分析?

严谨和可信的Meta分析,其作者团队应该有足够的统计学专业知识和严谨性,特别是多学科组成的国际研究合作组织,如Cochrane合作组织。高质量的Meta分析往往也是在规范的学术期刊上发表,和所有学术文章一样,仔细的同行评审最重要,以确保方法学的高质量。

10、我应该推荐一位初级研究者是将时间花在Meta分析还是原创研究上?

建议所有初级研究者都应该进行原创性研究,因为这提供了一个独特机会,使自己能够专注于假设的提出、研究设计、数据收集和结果报告。然而,了解Meta分析对任何研究人员也至关重要。参与系统评价和Meta分析往往是熟悉某一主题、完善方法学知识的绝佳途径。

参考文献:
1. Eur Heart J.2022 Jun 17;ehac312.

2. Int J Evid Based Healthc. 2015;13(3):196-207.

3. Eur Heart J. 2014;35(47):3336-3345.


文章来源:医咖会

没有账号?