临床预测模型的常用形式及优缺点详解_临床研究_实用技巧

临床预测模型会根据患者的年龄、性别、生物标志物等预测变量来估计患者发生某种疾病(诊断模型)或未来出现某一结局(预后模型)的风险。

Bonnett及其同事提出了临床预测模型展示形式的指南，以便其在临床实践中使用。

本文描述了四种展示临床预测模型的形式，并讨论了每一种形式的优缺点。

下载.jpeg

论文标题

目录

1. 介绍
2. 评分系统

2.1 描述
2.2 怎么构建评分系统？
2.3 优点和缺点
2.4 应用

3. 图形评分表

3.1 描述
3.2 怎么构建图形评分表？
3.3 优点和缺点
3.4 应用

4. nomogram图

4.1 描述
4.2 怎么构建列线图？
4.3 优点和缺点
4.4 应用

5. 网页计算器和手机APP

5.1 描述
5.2 怎么开发网页计算器或APP？
5.3 优点和缺点
5.4 应用

6. 结论

1. 介绍

每年临床医学领域都会出版很多的预测模型文献，大多数预测模型都是基于logistic回归和Cox回归模型开发出来的。

TRIPOD声明为多变量预测模型研究的报告提供了指导，但是在如何展示临床预测模型上提供的信息较少。在选择预测模型的展示形式时，研究者应仔细考虑目标群体、使用环境和使用时间。

哪些患者需要使用预测模型？在什么时候什么地方使用？思考这些问题会有帮助。

在出版的期刊论文中应该列出完整的预测模型方程式，这对于进行独立的外部验证很有帮助。

在临床环境中，除了完整模型方程外，可能需要使用其他的展示形式。

预测模型的展示形式因以下因素不同而不同：

使用媒介：是纸质版还是电子版；
使用环境：是门诊、社区诊所、病房还是在家中；
预测信息的详细程度：是近似估计还是精确估计；
预测模型使用的友好程度。

表1列出了展示预测模型的不同形式。

下载 (1).jpeg

本文以框2的生存模型为例(该模型预测了原发性胆汁肝硬化患者随时间推移的死亡风险)，来说明模型的展示形式，logistic回归模型开发的风险预测模型也是适用的。

下载 (2).jpeg

框2

数据来自于硫唑嘌呤治疗原发性胆汁性肝硬化的疗效试验。248例原发性胆汁性肝硬化患者符合试验入选标准，其中127例为治疗组，121例为对照组。治疗组死亡57例(45％)，对照组死亡62例(51％)。
感兴趣的预测变量包括年龄(岁)，肝硬化(是/否)，白蛋白(g/dl)，中央胆汁淤积(是/否)和安慰剂治疗(不是硫唑嘌呤治疗，是/否)。

2. 评分系统

2.1 描述

在评分系统中，预测模型会根据每个患者预测变量的预测值来评分，并计算出一个总分。总分可以反映患者发生某种疾病或出现某一结局的风险。

评分系统的使用群体是住院医师和患者，评分系统可以作为就诊咨询的一部分显示在电脑屏幕上，也可以打印出来交给患者，或在病房中使用作为参考指导。

2.2 怎么构建评分系统？

首先要建立好一个预测模型，可以使用logistic回归或Cox回归模型来建立。然后根据预测模型中预测变量的回归系数为预测变量分配一个整数分值，该分值可以为正数，也可以为负数。

在为预测变量分配整数分值时，模型中所有的连续变量都要转化为分类变量，因此预测模型的准确度会有损失。转化为分类变量时，每个类别水平不需要一定相等，并且可以通过不相等的类别水平来更合适的处理非线性变量。

开发评分系统的步骤参考：

下载 (3).jpeg 逻辑回归和Cox回归预测变量赋分参见此篇文章

请注意：有些评分系统是根据HR或OR而不是根据回归系数β计算出来的。This approachis mathematically inappropriate as Cox (or logistic) regression models assume additivity of the log hazard (or log odds) ratios.

除了构建评分系统外，还需要提供每个得分点的风险概率表，以便将评分转换为预测风险值。

除非很清楚明确的定义了如何在预测的绝对风险量表上进行决策，否则仅仅基于总得分(如低、中或高风险)的决策是毫无意义的。

2.3 优点和缺点

建立好评分系统后，应在评分系统旁边给出使用说明。在给出解释和说明后，评分系统很容易理解。

根据模型的复杂性以及包含在模型中预测变量的数目，基于纸质的评分系统可以将患者预测变量的值输入到网页计算器或APP中更快的计算风险。

患病风险或者生存率的预测仅仅是完整模型中实际预测风险的近似值。这是因为连续变量的信息在转换为分类变量进行赋分时损失掉了一部分，并且赋分时“回归单位”的四舍五入又损失了一部分。

研究人员必须检查基于评分系统的简化模型的预测性能是否与原始完整模型相似，并且检查是否与原始完整模型具有相同的潜在临床影响。

2.4 应用

表3a是根据原始预测模型推导出来的原发性胆汁性肝硬化患者死亡概率的评分系统，表3b为评分系统中每个得分对应的1年和3年死亡概率。

下载 (4).jpeg

如某患者年龄55岁(0分)、肝硬化(3分)、白蛋白34.4g/gl(0分)、中央胆汁淤积(5分)，总分为8分。根据表3b，可以得知其1年时死亡概率为45.8%，3年时死亡概率为90.2%。

从原始预测模型的完整方程式中计算出1年和3年的死亡概率分别为44%和89%。这些数据表明，与原始完整预测模型相比，预测模型简化后的评分系统只有很小的变化。

3. 图形评分表

3.1 描述

图形评分表是高度简化的、使用彩色编码的评分系统。与评分系统相似，图形评分表也是临床预测模型的展示方式之一。

图形评分表既可以在电脑屏幕上使用，也可以打印出来。使用该表的一个例子就是用于预测心血管疾病的SCORE模型。

3.2 怎么构建图形评分表？

如框1中所述，首先必须为预测变量的每个组合计算结局的概率。然后根据临床上重要的风险类别对概率进行制表和颜色编码。如具有较高风险的(接近1)可以编码为红色，风险较低的(接近0)可以编码为黄色。

颜色越红代表患病风险越高。患者根据自身情况快速锁定色块，并且获知自己的患病风险。

3.3 优点和缺点

和评分系统相比，图形评分表更加容易理解，并且采用颜色编码可以提高易用性。另外，患者的临床决策可以和预测模型结合，如在图形评分表中，患者如果评估风险为深红色，可以考虑转ICU治疗。

图形评分表通常需要对模型进行某种简化，因为它只能容纳有限数量的预测变量，并且需要将连续变量转换为分类变量显示。

因为预测结果通常显示为预测风险的范围而不是准确数值，所以采用这种表也会丢失预测风险的信息。

图形评分表的另一个缺点是每一个感兴趣的时间点都需要使用独立的图形评分表。

与评分系统一样，研究人员也应检查简化后的图形评分表的预测性能(在每一个感兴趣的时间点)是否与原始完整模型相似。

3.4 应用

图1显示了原发性胆汁性肝硬化患者的评分图表。该图表是使用表3a和3b的评分系统建立的。

下载 (5).jpeg 图1 根据框2中原始预测模型推导出来的计算原发性胆汁性肝硬化患者死亡概率的图形评分表，该表仅限于接受硫唑嘌呤治疗的患者

根据此评分图表，一个患者55岁，有肝硬化、中央胆汁淤积、白蛋白为34.4g/gl，并接受硫唑嘌呤治疗的患者1年死亡风险为46%，和完整的原始预测模型计算出来的44%差不多。

4. nomogram图

4.1 描述

诺莫图，又叫列线图，是临床预测模型的另一种图形表示方式(图2)。跟评分系统一样，也是基于个体预测变量的数值来计算得分，然后根据得分计算某事件或生存概率的风险。

下载 (6).jpeg 图2 列线图可以计算原发性胆汁性肝硬化患者1年和3年的预测死亡概率

4.2 怎么构建列线图？

构建列线图的步骤如下：

对于模型中的每一个预测变量，通过将预测变量的回归系数乘以数据集中该预测变量的极差(最大值和最小值的差)，来计算推导模型中线性预测变量的最大变化，通过计算的变化来对预测变量进行排序。
每一个预测变量的得分最多为100分。首先将步骤1中计算的变化最大的预测变量分配100分，这个预测变量叫做预测变量A。然后分别计算其他预测变量的得分，计算公式为=100*(其他预测变量的最大变化/预测变量A的最大变化)。
根据所有可能的预测变量组合来计算总分的最小值和最大值，然后将预测模型的总得分投影到到概率尺上。

可以使用R(rms包)以及Stata(logistic回归使用nomolog，Cox回归使用nomocox)来绘制诺莫图。

4.3 优点和缺点

与其他的展示方式相比，列线图的主要优点是不需要对连续变量进行分类，并且可以基于总得分合并多个概率尺度，来将多个感兴趣的时间点包含在一个列线图中。

另外，可以通过列线图中的线条长度来判断预测变量的相对重要性。对于复杂的模型，如包含时间依赖性预测变量的模型，也可以使用列线图来展示。列线图使用起来很容易，特别是当模型中仅包含少量预测变量时。

列线图第一眼看上去可能显得较复杂，并且需要解释如何使用列线图，这一点在TRIPOD声明中也着重说明了。

此外，如果出版论文中列线图的大小和分辨率较差的话，计算出来的风险概率可能不准确。模型中包含的预测变量越多，列线图的解释难度就越大。

4.4 应用

图2显示了原发性胆汁性肝硬化患者的列线图，为了计算某一时间点的生存概率，使用者可以通过每个预测变量的值对应的顶部得分来计算患者的总得分，然后通过总得分来读取对应的风险或生存概率。

下载 (6).jpeg 图2 列线图可以计算原发性胆汁性肝硬化患者1年和3年的预测死亡概率

从图2可以看出，患者年龄为55岁(24分)，肝硬化(42分)，白蛋白34.4g/gl(65分)，中央胆汁淤积(62分)，使用硫唑嘌呤治疗(0分)，总得分为193分。这对应的1年和3年死亡概率分别为40%和85%，这个结果和直接从原始完整预测模型中计算出来的生存概率(44%和89%)相似。

治疗预测变量中安慰剂治疗编码为1，硫唑嘌呤治疗编码为0。

5. 网页计算器和手机APP

5.1 描述

越来越多的预测模型可以通过网页计算器、平板电脑或智能手机的APP来计算评估风险，这些计算器或者APP通常是交互式的图形应用界面，可以根据预测模型提供个性化的风险估计，风险估计值需要使用者输入患者预测变量的值来计算。

5.2 怎么开发网页计算器或APP？

目前已经开发了各种各样的网页计算器。网页计算器和APP除了可以供住院医师和普通患者使用外，世界各地对这个感兴趣的人都可以使用。

这些网页计算器或APP也可以设计成在特定情况下使用，比如要求用户注册、登录添加用户详细信息。

网页计算器的网站上需要明确说明预测模型的使用人群，并且应该清楚的描述怎么去使用这个模型。还应该提供预测模型开发、后续验证以及可能的临床影响评估的参考信息。

开发人员应仔细检查网页计算器或者APP，确保预测概率与原始预测模型的预测概率相符。

对于包含连续变量的预测模型。应该限制输入超出范围的数值，这个范围指的是开发数据集中连续变量的数值范围，如果没有限制输入，至少也要向使用者发出警告信息。

5.3 优点和缺点

使用网页计算器或APP的一个主要优点就是，完整的模型方程式可以嵌入到后台网页中，不是计算的近似值，并且使用起来也很简单。

网页计算器或APP可以为复杂的统计模型(如包括大量预测变量、非线性项和交互作用)提供用户友好度很高的图形界面。

另外，许多数据的输入可以自动化。在一般情况下，患者的年龄和性别可能已经记录在了医疗中心的计算机系统中，可以在电子健康记录中使用预测模型，向临床医生实时反馈信息，尽管部分缺失值或异常值的存在会使预测模型的准确度有所下降。

网页计算器和APP还应在实验室结果和人体测量学结果的单位之间进行轻松切换，提高易用性。

因为每一个人都可以创建网页计算器和APP，因此目前不能确保开发的原始预测模型是可以使用的，也不能保证预测模型已经对访问网站的相关人群进行了验证。此外，这种公共访问网站可能存在过度使用或者不适合该模型的人也会访问。

另外在访问网页计算器或APP时，用户的数据隐私和存储也是一个问题，如果网页计算器或APP需要收集使用者的数据，那么这个问题需要在网页计算器或APP上面明确说明。

最后，预测模型可能会随着时间的推移而更新，用来反应潜在人口特征的变化，因此网页计算器或APP的设置也要相应修改，需要记录模型更新的原因，并在网站或APP上清楚说明。

5.4 应用

网页计算器的一个例子就是新西兰的“您的心脏预测”工具，这个工具提供了图形设计，可以将患者预测的心血管疾病风险与相同年龄的健康人群的风险进行比较。考虑到患者可能不容易理解这个风险的含义，该模型还提供了心脏年龄的图形化描述以及未来预测。

其他例子包括GRACE(用于急性冠脉事件)、ASCVS Plus(用于动脉粥样硬化性心血管疾病)和Predict(用于乳腺癌)。UK-PBC和GLOBE是两个原发性胆汁性肝硬化的网页计算器示例，但与本文的示例相比，它们的预测变量不同。

下载 (7).jpeg

6. 结论

当临床预测模型经过验证可以在临床实践中使用时，预测模型的展示形式是一个重要的考虑因素。

清晰明确的展示预测模型是确保其他研究人员可以独立验证模型的基础，并且确保临床医师和其他人员在医疗领域中使用该模型。

除了提供完整的模型方程式(必不可少)外，还有很多形式可以展示模型以帮助其在临床中使用，如评分系统、列线图、网页计算器和APP。

如果需要以简化的方式来展示模型(如将连续变量转为分类变量)，在用于临床实践之前，这个简化的模型应该经过与完整模型相同的验证。

最好的预测模型展示形式应该根据使用者和临床环境而异。鉴于这个原因，最好通过利益相关者(包括医师和患者)的参与来确定最佳的展示形式。

对于使用高级技术如机器学习等开发的模型，也需要类似的指南。

注：简单翻译，如有错误不解之处，请查阅原文献。

科研星球

临床预测模型的常用形式及优缺点详解