统计分析数据时的几大常见错误详解_统计与绘图_实用技巧

本文参考自《Am J Gastroenterol》（影响因子：9.566）上的一篇文章《Ten common statistical errors and how to avoid them》^[1]，本文主要来看看数据分析时的常见错误。

1. 用组内比较推断组间差异

很多研究会在基线水平和一个或几个随访时间点对研究指标进行测量（例如随机临床试验的治疗前和治疗后），作者也可以对两组或多组的指标测量值的变化进行分析（例如RCT中的安慰剂组和治疗组）。常见的结果就是治疗组前后有明显的改善，而安慰剂组并没有明显的改善。很多作者的分析到此结束，并就此认为治疗是有效果的，但是事实并非如此。

例如，某项研究用来评估A、B两种降压药的效果^[2]，一组给予A药，组内用药前后比较显示其效应值和标准误为25 ± 10，差异有统计学意义（P<0.01）；另外一组给予B药，组内用药前后比较显示其效应值和标准误为10 ± 10，差异无统计学意义。

此时容易得出“两种药物的疗效明显不同”的结论，认为A药的疗效优于B药。但是事实上对两组进行比较，差异并无显著性（P > 0.05），两组间比较显示A、B两种药物的效应差值为15，标准误为微信截图_20210824152925.png = 14。“两种药物的疗效明显不同”的结论是不正确的。

【建议】为了证明一组的治疗效果明显优于另外一组，组内比较是不够的，而应该对组间的差异进行比较。

2. 将有相关性的数据

当独立数据进行分析

许多研究都会对研究对象进行多次（重复）测量。例如，患者可能会多次进行食道、胃、十二指肠镜检查，每一次检查都会提供一个或多个不同组织活检的结果。如果将这些结果看作是独立的，会忽视同次活检的不同组织之间的相关性，以及同一患者多次活检之间的相关性。

举例而言，有两种不同的方法获取100份活检组织，如图所示：

微信截图_20210824153018.png

显然a方法有更好的代表性。对上述两种方法所获得的数据进行分析，由于b方法获得的数据有相关性，若按照独立数据来进行分析，则会高估研究的精确性。忽略这种相关性会导致方差估计值偏小，使得检验效能看起来比实际要高，因而可能会导致拒绝无效假设，然而事实上研究资料并不足以得出这样的结论。

【建议】选择适合重复测量资料的统计学方法，例如，重复测量资料的方差分析、混合效应模型。需要注意的是，文章中应该明确模型的假设、验证假设所使用的方法以及处理相关数据所使用的方法。

3. 在匹配的病例对照研究中

没有采用匹配的分析方法

病例对照研究中，病例组均为患有某种疾病X的研究对象，而对照组通常为与病例组可比的、未患有某种疾病X的研究对象。在1:1匹配的病例对照研究中，对照组和病例组的研究对象需要在一个或多个可能的混杂因素上进行匹配（例如，年龄、性别、BMI），以提高统计学功效。

【建议】若采用了匹配的病例对照研究设计，则在样本量计算和统计分析时需要采用与“匹配”研究设计对应的分析方法。例如，在匹配的病例对照研究中，应采用条件Logistic回归，将每对匹配的病例和对照均看作一层，来对疾病的危险因素进行评估。

4. 对“生存数据”以固定观察时间分析

未考虑截尾数据或随访时间的差异

队列研究中，研究对象出现某种结果的时间通常是不同的。这种随访时间的不同包含失访或出现截尾数据的情况。例如，通过结肠镜检对某特定人群进行结肠癌筛查，并且随访观察结肠癌的发生情况。

如果所有的研究对象都具有统一的观察期（例如6个月），那么就可以利用卡方检验来分析该因素与6个月结局发生率之间的关系，或者可以用Logistic回归对潜在的混杂因素进行调整。若各个研究对象的随访时间不同或研究中有不少截尾数据的存在，则采用生存分析法更为合适。

【建议】如果医学上有必要区分“早期发生”或“晚期发生”，那么“未发生”结局事件（上例中即为未患结肠癌）的研究对象的数据就很重要，此时应该使用Kaplan-Meier法来对6个月发生率进行估计。在这种情况下，相比使用Logistic回归来探讨某些影响因素，使用Cox比例风险模型更为合适。

参考文献

1. Am J Gastroenterol. 2008 Feb;103(2):262-6.

2. The American Statistician,2006,60(4):328-331.

科研星球

统计分析数据时的几大常见错误详解

标签