科研星球

SPSS 教程:Poisson回归在二分类结局的应用

在上一篇文章中,我介绍了Poisson回归在离散定量Poisson分布数据的应用。不过,更多的时候,包括横截面调查、队列研究、随机对照研究,研究结局为二分类结局,这一结局不符合Poisson分布数据的特征,往往数据出现过度离散的情况。


在观察性研究的队列研究和横截面调查中,通常是分类结局的随访资料,研究者习惯于应用 logistic回归分析来控制混杂变量计算调整优势比( aOR)作为调整相对危险度( aRR) 的估计值。然而这样做却忽略了一个基本的假设:即只有在研究的结局事件较为罕见的条件下, OR 才近似等于 RR ;反之, 当结局事件的发生率较为常见 ( >10 %) 时,OR 往往会明显的高估或低估真实的 RR 值。对于此类资料如何调整混杂因素合理计算 aRR 的点和区间估计值, 2004 年 Zou提出可利用修正 poisson回归法来加以处理,使得 aRR 区间估计值的精确度有了很大的提高, 获得了较为满意的效果, 本文拟对该法加以介绍,并给出例子行具体说明 。


Poisson 回归通常适合于处理罕见结局事件的前瞻性研究资料,即服从 poisson 分布的资料。当将其应用于服从二项分布的资料时, 对 RR 的估计误差便会增大, 但是这个问题可以通过一种稳健的误差方差估计法( sandwich variance estimator,俗称三明治法) 得到矫正, 这被称之为Modified poisson 回归。


举例: 吸烟与肺癌发病关系的队列研究

下载.jpeg

如果手工,计算RR值如下:
下载 (1).jpeg


我们通过M-H方法计算RR值和95%CI 结果如下:RR=13.5,95%CI: 5.41-33.41。RR值置信区间不包括1,也说明RR总体不等于1。

下载 (2).jpeg


对于这样的队列研究数据,如果我们采用logistic回归,会得到一下结果:

下载 (3).jpeg

OR=15.85,由于肺癌发生率较低,因此OR值与RR值比较接近,但也高估了RR值。


如果我们采用普通的Poisson回归,则会得到一下结果:

下载 (4).jpeg


可以看出,RR=13.5,但其置信区间较M-H方法计算得到要宽些。


现在我们采用修正Poisson回归的方法进行


对于SAS,可以 调用genmod 函数。

值得一提的是在进行修正 poisson 回归分析时, 要求以原始资料的格式来创 即一名研究对象为一条观测, 并且需增加一个变量( 如 id 等) 来表示研究对象的编号, 不能以频数表的形式来建立数据集 同时需要增加一个repeated 过程

proc genmod data = A ; 

model cancer = smoking  /link = log dist = poisson; 

REPEATED SUBJECT =id ; 

run;


对于SPSS软件,调用广义线性模型

下载 (5).jpeg


下载 (6).jpeg


结果如下

下载 (7).jpeg

RR值同样为13.5,但是置信区间便窄于一般的Poisson回归,而与M-H分析结果相同了。


当然Poisson回归更多的作用是可以开展多因素回归,或者控制混杂偏倚,这是普通的单因素M-H方法所不能比拟的。


多因素Poisson 回归

某医师基于某医院开展前瞻性队列研究,探讨冠心病患者复发有关的影响因素,收集新发冠心病患者作为病例组,收集同期医院非循环系统疾病患者作为对照组,研究的暴露因素是病人的年龄age、性别sex、心电图检验是否异常ecg、高血压hyper、糖尿病diabetes。


通过构建多因素Poisson 回归,得到以下多因素回归分析的结果:

下载 (8).jpeg


相关推荐:

汇总!SPSS零基础资源教程技巧合集!

SPSS Statistics 26.0 for Mac/Win 最强大的统计分析软件

「视频教程」北京大学 医学统计学与 SPSS 软件(基础篇)

「视频课程」每天十分钟学会SPSS 27节全

SPSS教程:信度分析之克朗巴哈系数(Cronbach's α)

如何通过SPSS寻找最佳的曲线拟合方法

如何利用SPSS进行秩和检验

更多SPSS相关内容……




没有账号?