科研星球

整群随机试验

本文为研究者手稿,版权已转让《中国卒中杂志》。正式文章请见朱之恺,谷鸿秋,姜勇. 整群随机试验 [J]. 中国卒中杂志, 2022, 17 (12) : 1403-1409.

临床研究中,欲评价某项群体性干预措施(如社区健康宣教)的效果时,若以个体为单位进行随机分组,有可能并不合适,因为对照组的研究对象也极有可能暴露于干预措施下,出现组间“沾染”的情况,导致效应估计出现偏差。此外,有些研究采用个体层面的干预,在经济上和实际操作上不太可行。鉴于此,整群随机试验在临床研究中的应用日益增多,但广大的临床研究者对其仍较为陌生。作为新型随机对照试验设计与解读系列之一,本文将从整群随机试验的理论依据(历史渊源、基本概念、设计思路、优劣异同)和应用探索(应用场景及案例解读、统计分析方法、报告规范)两大方面做一系统介绍。

1 历史渊源

跟临床试验的发展简史一致,18世纪以前是整群分配的原始萌芽时期。1648年,Van Helmont对发热病人分堆抽签决定采用放血还是催吐治疗,可以算作最早体现“群”思想的研究[1]。1657年,Starkey试验将患者分为10人一组,然后轮流将每10名患者分成两组,每组5人,可以体现试验前分群的理念[2]。18世纪到20世纪50年代,是整群随机试验的科学原则形成时期。1900年,Celli进行了一项蚊帐是否能减少意大利铁路工人家庭患疟疾风险的试验,是Lancet上第一个发表的以群(家庭)为单位进行分组的试验,该试验也预示着将来整群随机试验会广泛应用于评估传染性疾病控制方法[3]。1931年,随机、盲法等方法学概念出现。Lindquist在《教育研究中的统计分析》一书中对整群随机试验的方法学进行了初步讨论,书中写到从爱荷华州所有公立学校的八年级学生中抽取500名学生样本,如果随机化以个体为单位进行,最终选定的学生将广泛分布在爱荷华州整个州的几百所不同的学校中,组织实施复杂且成本高,而按照学校来抽样,实际操作更可行[4]。当时许多整群随机试验是以学校为基础的教育干预评估,主要应用于教育领域,而非医学领域。

1980年以后医学领域的整群随机试验文献逐步增长,比如1985年钼靶筛查乳腺癌有效性的研究中,为避免个体随机对照试验中可能由于家庭成员或社区内部存在交流导致对照组会受到干预组的影响,出现违背方案(Protocol deviation,PD)的“沾染”情况,选取了瑞典两个约相距200公里、具有明确地理分界的社区作为分组单位[5]。1989年,探索胎动计数对孕晚期产前胎儿死亡效果的试验也采取了整群随机试验设计,用来减少沾染对干预效果的影响[6]。1991年有研究提出采用整群随机试验来解决个体随机设计的疫苗临床试验无法评估疫苗给人群带来的群体保护效应(随着免疫接种覆盖面扩大,可同时保护未接种疫苗或免疫失败的易感人群免受感染)[7]。整群随机试验作为一种可评估疫苗间接效果的理想设计,能体现疫苗的公共卫生意义,是疫苗临床试验中重要的方法[8]。

为了更好地监管、指导这类临床试验,2004年扩展到整群随机试验的《试验报告统一标准(CONSORT)》正式发表,此后整群随机试验成为这类试验最常用的术语。2012年,整群随机试验的报告规范—CONSORT扩展声明更新,也见证了这一研究设计类型的发展。

2 基本概念

2.1 定义

整群随机试验(cluster randomised trials,CRT)是将研究对象以群为单位进行随机分配的一种试验设计。《试验报告统一标准(CONSORT)》中介绍整群随机试验为以具有某些共同特征的个体构成的群(如家庭、社区等)而非单个个体作为研究对象,采用随机分配的方法(单纯随机、分层随机等)将整个群分配到不同处理组,以整群为研究对象进行干预、随访,比较不同处理组的效应[9]。

2.2 各种名称

除了整群随机试验,这种试验设计也有很多其他的中英文名称(表1),其中“整群”、“群”、“群组”意思相同,推荐使用“整群随机试验”和“cluster randomised trials”作为标准术语,但当检索文献时,需要扩大检索策略,确保以“community”或“group”等为关键词的整群随机试验也被检索到,检索策略的确定可依据表1并结合实际情况。

表1. 整群随机试验的各种中英文名称

中文术语英文术语
整群随机试验(推荐)cluster randomised trials(recommended)
群随机对照试验cluster randomised clinical trials
整群随机临床试验cluster randomised controlled trials
整群随机对照临床试验cluster randomization trials

field trials

community based trials

group randomised trials

place based trials

2.3如何理解“群”?

整群随机试验的群可以是由多个个体组成的学校、医院、病房、村庄、乡镇、社区或家庭等,或医生的主管患者群体,可以是由个体的多个部位(如多个牙齿或眼睛、器官)或单个个体被重复观察的数据组成。

群内个体具有某些共同特征,即群内受试者存在群内相关,这种群内个体的相关性称组内相关系数(intra-cluster correlation,ICC),组内相关系数的公式为 微信截图_20230207215242.png ,是群间变异占总变异(群间方差+群内方差)的比,ICC 越高,说明群间的变异越高,群内的一致性越强,也即群内个体的相关性越强。整群研究的效应估计中,如果不考虑ICC ,则有可能得出有偏倚的结果。

3 设计思路

整群随机试验设计思路有六步走,第一步确定研究问题,第二步根据研究目的,确定研究现场和群,第三步确定干预措施和结局变量,第四步计算样本量,第五步随机化分组,最后进行数据的收集、整理与分析。如图一流程图所示,从招募、分配、随访到数据分析的全过程,均要体现群和受试者两个水平在试验中数量变动情况。

第一步研究问题的确定同传统随机对照试验一致,按照PICOS的问题框架[10],即P-population人群、I-干预、C-control对照、O-outcome结局、S-study/setting研究设计类型或场所5个方面进行明确的定义。关于整群随机试验的设计类型,除了平行组设计、析因设计、交叉设计三大最基本的设计方法,也常采用阶梯设计。阶梯设计(stepped wedge CRT)基本原理类似于交叉设计,但在每一个时间点均会有新的群接受干预,最终所有组均将接受干预。经验提示,整群随机试验多数采用实用性研究设计的设计理念,实用性研究设计是真实世界研究的重要构成,比较的是临床上可行的两种或多种干预措施,对照组常选用常规治疗而非安慰对照。

关于第四步样本量应有两点认识,一为整群随机试验和传统随机试验样本量的关系:整群随机试验所需的样本量等于用传统随机试验公式计算出的样本量乘以方差膨胀因子。方差膨胀因子又称设计效应(design effect,DE),指当总样本含量相同时,按照研究所采用的抽样方法计算得到的方差与采用单纯随机抽样方法计算得到的方差之比,受组内相关系数ICC和群内个体数m的影响,公式为微信截图_20230207215258.png。二为当群数量、目标差异、显著性水平一定时,随着群规模(群内个体数m)的增加,试验的检验效能和精确性也会增加,但是当群规模增加到一定数量(m=2/ICC)时,试验的检验效能和精确性的增加就不会太多,甚至几乎不增加[11]。这说明在研究中包含大量的“大型”整群是没有帮助的,纳入更多的整群比纳入更多的个体会产生更高的检验效能,即100个规模大小为10人的整群,比10个规模大小为100 人的整群检验效能更强。

按照在随机化分组的概率在实验中是否保持一致,第五步随机化分组可分为固定随机化和动态随机化。固定随机分组的核心是人人平等,即研究对象都能够按照机会均等的原则被分组,常见的有完全随机化/简单随机化、区组随机化、分层随机化、分层区组随机化。动态随机分组,每个研究对象被分入某组的概率不是固定不变的,为了保障组间例数相近,有偏性掷币法和瓮法,为了保障分组后组间影响因素均衡,有最小化法。

0.png图1. 整群随机试验流程图

4 优劣异同

整群随机试验与传统随机对照试验在研究设计、实施场景、对象选择、样本量的考虑、统计分析及结果上均有不同程度的差异,两者都有各自的优势和局限性。

4.1 优越性

整群随机试验的优越性主要体现在①可评价难以落实到个体上的干预措施:如健康教育、政策类、公共卫生措施效果的评价,整群随机试验是较为合适的研究方法。②依从性好:以群为抽样、干预和分析单位,群内的研究对象依从性更好。③组织实施方便:以群为随机单位,能减小研究组织实施难度,可行性高,受到的伦理学挑战也会较少。④减少“沾染”:组间交流的存在很可能使两组间差异缩小,而得到假阴性的结果,导致干预失败。整群随机试验受“沾染”的可能性更小,试验结果更可信,且研究费用较低。⑤干预措施易推广:干预措施更接近人们的自然生活状况,在实际工作中更容易被受试者接受,因此易推广与使用。

4.2 局限性

整群随机试验在设计和分析阶段相对复杂,其局限性主要体现在①样本量更大:整群随机试验要求整群间与结局高度相关的基线特征的差异越小越好,抽样得到的整群能够代表总体。与个体随机试验相比,整群随机试验所需的样本量更大,可能出现基线不均衡。②无法设盲:干预具有多而复杂性,常常无法对研究参与人员设盲,存在自报结局的偏倚风险。③统计分析方法特异:群内个体往往有相似性,数据不相互独立,忽略“群效应”的统计分析导致假阳性。

4.3 和传统随机对照试验的异同比较

整群随机试验和传统随机对照试验的最大区别是分配单位不同,前者是群体水平(cluster)后者是个体水平(individual)。两者在设计、样本量、统计分析及结果报告上的主要区别见表2的总结[12]。

表2. 整群随机试验与传统随机试验的异同比较

因素传统随机对照试验整群随机试验
设计以个体对象为基础,研究对象、干预措施、随机化方案等都基于个体以“群”为基础,研究对象、干预措施、随机化方案等都基于“群”
样本量考虑效应、Ⅰ类错误、Ⅱ类错误还需考虑群数量、群大小、群内相关系数,样本量相对较大
统计分析及
结果报告
无需考虑群集性,分析方法较为简单考虑群间变异,分析方法复杂;比较个体和整群水平的基线资料;给出结局的群内相关系数,统计方法为广义估计方程、多水平模型等;CONSORT工作组专门制定了整群随机试验的CONSORT指南

5 应用场景及案例解读

整群随机试验的应用场景主要为公共卫生措施评价和医疗质量评价。近3-4年来发表在NEJM、Lancet、JAMA、BMJ四大期刊的整群随机试验归类为公共卫生措施(降压[13]、降糖[14]、减盐[15]、戒烟[16])、医疗质量(值班时间[17, 18]、护理[19, 20])、肿瘤学(化疗毒性[21]、筛查[22])、老年医学(跌倒[23, 24]、骨折[25] )和传染病防控[26]等几个领域。在卒中领域的应用的经典案例有卒中一级预防研究(中国农村高血压和糖尿病患者的药物和生活方式干预[27])、卒中二级预防研究(全球六国的卒中患者平躺或坐立的头部姿势对预后的影响[28])和卒中质量改进研究(多方面质量改进干预是否能提高中国急性缺血性卒中(AIS)患者对循证绩效指标的依从性[29])等。

以下列举两个案例解读,以期帮助临床研究者更好地理解整群随机试验的设计理念与应用场景。

5.1 复方制剂药物预防心血管疾病效果的伊朗PolyIran试验

PolyIran试验旨在评估包括阿司匹林、阿托伐他汀、氢氯噻嗪、依那普利或缬沙坦在内的四组复方制剂能否预防心血管疾病的发生,其为嵌套在Golestan队列研究内的双臂、实用性整群随机试验研究。PolyIran试验以村庄为随机单位,从50045名40-75岁的Golestan队列研究人群中招募了6838人,其中3417人(116个群)在对照组,3421人(120个群)在试验组。试验组每日服用一次的复方片剂,对照组进行最低限度护理。按照计算机生成的数字列表分配群,三个区(Gonbad, Aq-Qala和Kalaleh)分层。研究发现,相比于最低护理限度组,依从性好的复方制剂组主要心血管事件风险降低更大(HR=0.43, 95%CI=0.33,0.55),不良事件发生数更少。复方制剂药物是防控心血管疾病的有效办法之一,特别是在低收入和中等收入国家。

5.2 脑血管病医疗质量改进转化技术体系研究

2014年项目组设计了一项多中心整群随机试验,该试验在全国随机抽选40家医院,其中20家医院分配到干预组,20家医院分配到对照组,每组2400例患者。干预组的医院作为一个独立整体执行脑血管病医疗质量改进转化技术体系的干预,记录在干预期内进入到该医院治疗的脑血管病患者并跟踪随访至1年。对照组医院不接受上述任何干预,只记录患者诊疗过程和结局的自然信息[30]。结果表明,实行了医疗质量改进转化技术体系干预的医院其脑血管病群体相比对照组1年复发率相对下降28%,致残率相对下降26%[29]。该研究找到了适宜技术向临床转化的有效途径,作为“基于循证证据的医疗质量改进成就的最佳代表”被国家卫健委作为脑血管病医疗质量改进的国家行政规范向全国发布。

6 统计分析方法

整群随机试验统计分析方法的选择原则同传统随机对照试验,充分考虑研究目的、设计类型、干预手段、结局变量和混杂因素,根据样本分布和选择的变量类型,决定合适的统计分析方法[31]。但其统计分析须考虑整群效应,否则干预效应值的可信区间太窄,增加假阳性的概率,容易犯 1 类错误,具体的方法可通过广义估计方程(generalized estimating equations,GEE)、混合效应模型(mixed effects model,MEM,也称为多水平模型,multilevel model,MLM)实现。具体而言,对于二分类变量,可以通过广义估计方程 (SAS软件中的PROC Genmod)或者广义混合效应模型 (PROC GLMMIX)来实现[32];对于连续变量结局,可以通过混合效应模型 (SAS 的PROC MIX)来实现;对于生存数据,则建议采用Cox比例风险的Frailty模型 (SAS 的PROC PHREG)。

7 报告规范

由于整群随机试验在设计、实施和分析阶段相对复杂,针对整群随机试验的报告有专门的最新版CONSORT2010指南声明[9],相对标准版CONSORT指南,补充内容有①采用整群设计的原理,②在计算样本量时如何考虑群集效应,③在分析时如何考虑群集效应,④体现整群和个体从分配到分析的流程。具体涉及到整群的检查清单如下表所示。

表3 整群随机试验报告统一标准新增及修改条目

五部分及细节修改/新增内容
标题及摘要修改标题及摘要中方法(受试者、结局变量、随机化)、结果(随机数量、纳入分析数量、结果报告)部分均需体现群水平
介绍

背景修改整群设计的合理性以及研究目的是个体还是群水平
方法

试验设计新增群的定义以及如何将设计特性应用到群的描述
研究对象新增群的纳入标准
干预措施修改详细的干预措施具体到群和个体两个水平
结局变量修改结局变量是群还是个体水平或两者皆有
样本量新增群的数量和大小、组内相关系数
随机化修改以群为单位随机分组;随机分配序列生成,群的招募,以及谁将整群分配给干预措施  将个体纳入群的机制(如完整枚举,随机抽样)  征求同意的对象是群还是个体水平或两者皆有,以及在随机化之前还是之后征求同意
统计方法修改需考虑群效应
结果

流程图修改随机分配、接受预期治疗并分析主要结果的群数量,群数量的变化(排除的群数量)
基线数据修改个体和群两个水平的基线特征
结果报告修改每次分析中每组群的数量,个体或群水平上的结果,以及每个主要结果的组内相关系数(ICC或k)
讨论

外推性修改群水平外推性(视情况)

参考文献

[1] MOBERG J, KRAMER M. A brief history of the cluster randomised trial design [J]. J R Soc Med, 2015, 108(5): 192-8.

[2] STARKEY G. Natures explicationandHelmont's vindication, or, A shortandsure way to a longandsound life being a necessaryandfull apology for chymical medicaments, and a vindication of their excellency against those unworthy reproaches cast on the art and its professors ... by Galenists, usually called Methodists [Z]//HELMONT F M V. London :; Printed by E. Cotes for Thomas Alsop ... 1657

[3] CELLI A. THE NEW PROPHYLAXIS AGAINST MALARIA: AN ACCOUNT OF EXPERIMENTS IN LATIUM [J]. The Lancet, 1900, 156(4031): 1603-6.

[4] Lindquist EF. Statistical Analysis in Educational Research. Boston: Houghton Mifflin, (https://www.jameslindlibrary.org/lindquist-ef-1940/), 1940. [Z].

[5] TABáR L, FAGERBERG C J, GAD A, et al. Reduction in mortality from breast cancer after mass screening with mammography. Randomised trial from the Breast Cancer Screening Working Group of the Swedish National Board of Health and Welfare [J]. Lancet, 1985, 1(8433): 829-32.

[6] GRANT A, ELBOURNE D, VALENTIN L, et al. Routine formal fetal movement counting and risk of antepartum late death in normally formed singletons [J]. Lancet, 1989, 2(8659): 345-9.

[7] HALLORAN M E, HABER M, LONGINI I M, et al. Directandindirect effects in vaccine efficacyandeffectiveness [J]. Am J Epidemiol, 1991, 133(4): 323-31.

[8]  高书瑜, 李靖欣, 金鹏飞, et al. 整群随机设计在疫苗临床试验中的应用 [J]. 中华流行病学杂志, 2021, 42(12): 2221-5.

[9]  CAMPBELL M K, PIAGGIO G, ELBOURNE D R, et al. Consort 2010 statement: extension to cluster randomised trials [J]. BMJ, 2012, 345: e5661.

[10] BROWN P, BRUNNHUBER K, CHALKIDOU K, et al. How to formulate research recommendations [J]. BMJ, 2006, 333(7572): 804-6.

[11] HEMMING K, ELDRIDGE S, FORBES G, et al. How to design efficient cluster randomised trials [J]. BMJ, 2017, 358: j3064.

[12]  陈新林, 莫传伟, 徐谦, et al. 整群随机试验的设计、统计分析方法及应用 [J]. 中国循证医学杂志, 2015, 15(06): 741-4.

[13]  SCHWALM J-D, MCCREADY T, LOPEZ-JARAMILLO P, et al. A community-based comprehensive intervention to reduce cardiovascular risk in hypertension (HOPE 4): a cluster-randomised controlled trial [J]. Lancet, 2019, 394(10205): 1231-42.

[14] LEAN M E, LESLIE W S, BARNES A C, et al. Primary care-led weight management for remission of type 2 diabetes (DiRECT): an open-label, cluster-randomised trial [J]. Lancet, 2018, 391(10120): 541-51.

[15] NEAL B, WU Y, FENG X, et al. Effect of Salt Substitution on Cardiovascular Events and Death [J]. N Engl J Med, 2021, 385(12): 1067-77.

[16] WHITE J S, LOWENSTEIN C, SRIVIROJANA N, et al. Incentive programmes for smoking cessation: cluster randomized trial in workplaces in Thailand [J]. BMJ, 2020, 371: m3797.

[17] SILBER J H, BELLINI L M, SHEA J A, et al. Patient Safety Outcomes under FlexibleandStandard Resident Duty-Hour Rules [J]. N Engl J Med, 2019, 380(10): 905-14.

[18] LANDRIGAN C P, RAHMAN S A, SULLIVAN J P, et al. Effect on Patient Safety of a Resident Physician Schedule without 24-Hour Shifts [J]. N Engl J Med, 2020, 382(26): 2514-23.

[19] FREUND Y, CACHANADO M, DELANNOY Q, et al. Effect of an Emergency Department Care Bundle on 30-Day Hospital DischargeandSurvival Among Elderly Patients With Acute Heart Failure: The ELISABETH Randomized Clinical Trial [J]. JAMA, 2020, 324(19): 1948-56.

[20] SALISBURY C, MAN M-S, BOWER P, et al. Management of multimorbidity using a patient-centred care model: a pragmatic cluster-randomised trial of the 3D approach [J]. Lancet, 2018, 392(10141): 41-50.

[21] MOHILE S G, MOHAMED M R, XU H, et al. Evaluation of geriatric assessmentandmanagement on the toxic effects of cancer treatment (GAP70+): a cluster-randomised study [J]. Lancet, 2021, 398(10314): 1894-904.

[22] HAHN E E, MUNOZ-PLAZA C E, POUNDS D, et al. Effect of a Community-Based Medical Oncology Depression Screening Program on Behavioral Health Referrals Among Patients With Breast Cancer: A Randomized Clinical Trial [J]. JAMA, 2022, 327(1): 41-9.

[23] LAMB S E, BRUCE J, HOSSAIN A, et al. ScreeningandIntervention to Prevent Falls and Fractures in Older People [J]. N Engl J Med, 2020, 383(19): 1848-59.

[24] BHASIN S, GILL T M, REUBEN D B, et al. A Randomized Trial of a Multifactorial Strategy to Prevent Serious Fall Injuries [J]. N Engl J Med, 2020, 383(2): 129-40.

[25] IULIANO S, POON S, ROBBINS J, et al. Effect of dietary sources of calciumandprotein on hip fractures and falls in older adults in residential care: cluster randomised controlled trial [J]. BMJ, 2021, 375: n2364.

[26]  CATTAMANCHI A, REZA T F, NALUGWA T, et al. Multicomponent Strategy with Decentralized Molecular Testing for Tuberculosis [J]. N Engl J Med, 2021, 385(26): 2441-50.

[27] WEI X, ZHANG Z, CHONG M K C, et al. Evaluation of a package of risk-based pharmaceuticalandlifestyle interventions in patients with hypertensionand/or diabetes in rural China: A pragmatic cluster randomised controlled trial [J]. PLoS Med, 2021, 18(7): e1003694.

[28] ANDERSON C S, ARIMA H, LAVADOS P, et al. Cluster-Randomized, Crossover Trial of Head Positioning in Acute Stroke [J]. N Engl J Med, 2017, 376(25): 2437-47.

[29] WANG Y, LI Z, ZHAO X, et al. Effect of a Multifaceted Quality Improvement Intervention on Hospital Personnel Adherence to Performance Measures in Patients With Acute Ischemic Stroke in China: A Randomized Clinical Trial [J]. JAMA, 2018, 320(3): 245-54.

[30] 李子孝, 赵性泉, 王拥军. 脑血管病医疗质量改进关键技术与体系的建立和应用——2020年度国家科学技术进步奖二等奖 [J]. 首都医科大学学报, 2022, 43(01): 6-12.

[31] 周齐, 杨凯璇, 姜英玉, et al. 基于登记/注册研究的随机对照试验 [J]. 中国卒中杂志, 2022, 17(10): 1145-51.

[32] BELLAMY S L, GIBBERD R, HANCOCK L, et al. Analysis of dichotomous outcome data for community intervention studies [J]. Stat Methods Med Res, 2000, 9(2): 135-59.


没有账号?