壹生大学

壹生身份认证协议书

本项目是由壹生提供的专业性学术分享,仅面向医疗卫生专业人士。我们将收集您是否是医疗卫生专业人士的信息,仅用于资格认证,不会用于其他用途。壹生作为平台及平台数据的运营者和负责方,负责平台和本专区及用户相关信息搜集和使用的合规和保护。
本协议书仅为了向您说明个人相关信息处理目的,向您单独征求的同意,您已签署的壹生平台《壹生用户服务协议》和《壹生隐私政策》,详见链接:
壹生用户服务协议:
https://apps.medtrib.cn/html/serviceAgreement.html
壹生隐私政策:
https://apps.medtrib.cn/html/p.html
如果您是医疗卫生专业人士,且点击了“同意”,表明您作为壹生的注册用户已授权壹生平台收集您是否是医疗卫生专业人士的信息,可以使用本项服务。
如果您不是医疗卫生专业人士或不同意本说明,请勿点击“同意”,因为本项服务仅面向医疗卫生人士,以及专业性、合规性要求等因素,您将无法使用本项服务。

同意

拒绝

同意

拒绝

知情同意书

同意

不同意并跳过

工作人员正在审核中,
请您耐心等待
审核未通过
重新提交
完善信息
{{ item.question }}
确定
收集问题
{{ item.question }}
确定
您已通过HCP身份认证和信息审核
(
5
s)

论著|利用联合模型动态预测IgA肾病患者进入终末期肾病的概率

2024-10-26作者:壹声资讯
非原创

乐伟波 施劲松 曾彩虹 梁少姗 李 喆 刘志红


[基金项目] 国家自然科学基金(81970620)

[作者单位] 东部战区总医院 国家肾脏疾病临床医学研究中心(南京,210016)

[通信作者] 刘志红(E-mail:liuzhihong@nju.edu.cn)

DOI:10.3969/j.issn.1006-298X.2024.01.001



摘 要 


目的:建立一个工具能够根据每次访视IgA肾病(IgAN)患者的病情变化,动态预测患者进入终末期肾病(ESKD)的概率。  


方法:选取1997—2007年在国家肾脏疾病临床医学研究中心长期随访的IgAN患者。利用联合模型(Joint model)分析IgAN患者所有访视点的产生纵向数据,实现动态预测患者ESKD的概率,以达到个体化动态预测的目标。我们首先以肾活检时刻为基准建立了临床模型(模型A)和临床病理模型(模型B)。模型A的生存子模型部分引入了年龄、性别、尿蛋白定量(Log转换)、估算的肾小球滤过率(eGFR)、eGFR下降斜率、血白蛋白水平等指标;纵向子模型部分引入了年龄、尿蛋白定量、eGFR、eGFR下降斜率以及血清白蛋白水平。模型B在模型A的基础上生存子模型上增加了牛津病理分类指标。模型C是以首次访视时间为基准重新拟合了模型A并评估了其性能。所有的纵向子模型采用访视时间t的非线性混合模型拟合。  


结果:本研究纳入了866例IgAN患者,以首次门诊就诊为基线,平均随访时间为12.2 ± 5.5年,共访视22 533人次,平均每个患者访视26次。随访中260例(30.0%)患者进入ESKD,其末次随访平均eGFR为9.1 ± 3.0 mL/(min·1.73m2)。将所有患者按照3∶1的比例,随机分为建模组(650例)和测试组(216例)。以肾活检时刻为基线,模型A与模型B的性能基本一致,二者均表现出较高的预测性能,纳入或者剔除病理学变量并未明显增加联合模型对ESKD风险预测的准确性。随着随访时间的增加,模型A的预测性能持续提升,在肾活检后第5年左右达到最佳性能。AUC值由肾活检时的0.864增至肾活检后第5年的0.956;Brier评分由肾活检时的0.124降至活检后第5年的0.058。以首次访视时刻为基线的模型C也取得了类似的结果。为方便临床实践,我们利用Shiny包实现了动态预测,并将相关模型R对象、源代码公布在网络上。  结论:联合模型可以用于IgAN患者访视点产生的纵向数据,高性能动态预测IgAN患者尿毒症的概率,实现个体化动态预测的目标。


关键词 IgA肾病 联合模型 动态预测 终末期肾病


Dynamic prediction of end stage kidney disease for patients with IgA nephropathy


LE Weibo, SHI Jingsong, ZENG Caihong, LIANG Shaoshan, LI Zhe, LIU Zhihong

National Clinical Research Center for Kidney Diseases, Jinling Hospital, Nanjing 210016, China

Corresponding author:LIU Zhihong(E-mail:liuzhihong@nju.edu.cn)


ABSTRACT 


Objective:To develop a personalized dynamically model to predict the risk of kidney failure for patients with IgA nephropathy (IgAN) using updates of longitudinal data at each follow-up visit.


Methodology:Three joint models were fitted to analyze the longitudinal data at each visit. We defined the baseline as the time of the kidney biopsy and fitted a clinical joint Model A, which included variables such as sex, age, eGFR, ALB, and proteinuria. We also constructed a clinical-pathological Model B, which incorporated both clinical and histological MEST features. Model C was fitted using parameters identical to those in Model A, however, the baseline was defined as the time of the clinical visit instead of the biopsy.


Results:A total of 866 patients were included (650 in the development cohort and 216 in the validation cohort) and contributed 10 565 patient-years of data, and 22 533 eGFR and proteinuria measurements. Models A and B performed similarly with high predictive ability. However, the inclusion or exclusion of pathological variables did not significantly increase or decrease the accuracy of the joint models for predicting kidney failure risk. As follow-up time increased, model A's predictive performance continued to improve, reaching optimal performance around 5 years after kidney biopsy. The AUC value increased from 0.864 at kidney biopsy to 0.956 at 5 years after biopsy, and the Brier score decreased from 0.124 at the time of biopsy to 0.058 at 5 years after biopsy. The model C achieved similar results. All predictive performances were confirmed in the validation cohort. To facilitate clinical practice, we utilized the Shiny package to implement dynamic prediction. The R objects and source code have been made publicly available online. Conclusion:The Joint model can be utilized for the longitudinal data generated from visits of IgAN patients, providing a high-performance dynamic prediction of kidney failure for IgAN patients. This helps achieve the objective of individualized dynamic prediction.


Key words IgA nephropathy  joint model  dynamic prediction  end stage kidney disease



IgA肾病(IgAN)是最常见的原发性肾小球肾炎[1-3]。既往的研究结果显示,30%~40%的患者会在发病后20~25年内缓慢进展为终末期肾病(ESKD)[2-3]。横断面调查研究结果显示估算的肾小球滤过率(eGFR)下降、蛋白尿、低蛋白血症、高血压是影响疾病进展的主要的临床指标[2];系膜增生(M)、毛细血管内细胞增生(E)、节段性肾小球硬化(S)、肾小管萎缩/间质纤维化(T)是影响疾病进展的主要的病理学指标[4-5]。2021 KDIGO肾小球肾炎指南推荐使用国际IgAN预后预测工具预测患者eGFR下降50%或进展至ESKD的概率,在临床上我们利用此模型可以对患者进行危险分层[6-8]。然而该工具仍然存在两个重要的遗憾:(1)该预测工具的终点事件设定为eGFR下降50%或进展至ESKD,而不是ESKD。因此该工具不能预测患者进入ESKD的概率,更无法预患者进入ESDK的时间。而预测ESKD概率和时间恰恰是临床医生和患者最关心的问题之一。(2)该工具属于传统的静态预测方法,只能在肾活检时刻使用,不适用于其他随访时刻。尽管后续的研究更新了预测方法,使得肾活检后1~2年内也能够使用[6-7],但更新后的国际IgAN预后预测工具仍然是基于横断面的数据,终点事件仍然设定为eGFR下降50%或进展至ESKD。


IgAN是一种慢性疾病,患者的病情不断变化,需要长期的随访治疗。纵向数据和生存数据伴随出现、相互关联。我们需要一个工具能够根据每次访视患者病情变化,动态预测患者进入ESKD的概率。联合模型可同时处理纵向数据及生存数据,能够纠正偏差,提高参数估计的效率并提供有效的推论[9]。为了弥补国际IgAN预后预测工具的上述两个重要缺陷,我们设计了本研究。一方面我们将研究终点设定为进展至ESKD,不包含eGFR下降50%;另一方面我们利用联合模型分析IgAN患者所有访视点的产生纵向数据,实现了动态预测患者ESKD的概率,达到个体化动态预测的目标。


对象和方法


研究对象  本研究纳入了866例在国家肾脏疾病临床医学研究中心长期随访的IgAN患者。纳入标准:(1)1997—2007年期间在国家肾脏疾病临床医学研究中心经住院肾活检确诊为IgAN;(2)随访时间>1年;(3)肾活检时年龄>18岁;(4)肾活检时eGFR>30 mL/(min·1.73m2),尿蛋白定量> 0.5 g/d;(5)肾活检后访视次数≥3次。排除标准:(1)IgAN-微小病变亚型(IgA-MCD);(2)缺乏IgAN牛津病理分型资料。


资料收集  我们收集了住院期间的患者人口学资料、检验检查资料和肾脏病理IgAN牛津分型等资料,并收集了所有访视中的24 h尿蛋白定量(PRO24H),一次性尿蛋白定量(UPCR),尿常规蛋白半定量(PRO),血清肌酐(SCr)、eGFR(采用CKD-EPI 2009公式),血清白蛋白(Alb)等资料。本研究的终点事件ESKD定义为eGFR<15 mL/(min·1.73m2)。


统计学方法

联合模型建模方法 联合模型由纵向子模型和生存子模型联合构成。我们建立了三个联合模型,即临床模型(模型A、C)和临床病理模型(模型B)。在临床模型A、C中,其生存子模型部分引入了年龄、性别、PR024H(Log转换后)、eGFR、eGFR下降斜率及Alb水平;纵向子模型部分引入了年龄、尿蛋白定量、eGFR、eGFR下降斜率及Alb水平。临床病理模型(模型B)是在临床模型的基础上,在其生存子模型部分引入了IgAN牛津病例分类指标(M、E、S、T),其纵向子模型部分完全一致。所有的纵向子模型采用访视时间t的非线性混合模型拟合。模型A和B访视时间t以肾活检时刻定义为基准时刻,而模型C以首次访视时间定义为基准时刻,即第一次在我院门诊就诊的时刻。


缺失数据处理 对于缺乏PRO24H的访视,我们先采用PRO24H~UPCR建立线性混合模型(随机截距、固定斜率模型),以利用UPCR填充PRO24H的缺失值;如果UPCR仍然缺失,我们建立PRO24H~PRO(尿常规蛋白定性)线性混合模型(随机截距、固定斜率模型),利用尿常规蛋白定性推断PRO24H的缺失值。共有 1 691人次(7.5%)的访视PRO24H值被填充。对填充后仍同时缺失eGFR和PRO24H的访视,我们将其删除。


模型评估 我们分别利用AUC值(即C-index)、Brier评分及校准曲线评估了临床模型和临床病理模型的性能。在所有模型中,我们将预测区间为固定值10年,预测起点(TStart)分别为基准时刻(0年)以及基准时刻后1~8年,预测终点(Thoriz)分别对应为基准时刻后10~18年。符合正态分布的计量资料采用均数±标准差进行描述,不符合正态分布的计量资料通过中位数(四分位间距)进行统计描述,计数资料采用率进行描述。P<0.05为差异有统计学意义。


结 果


一般资料  最终纳入了866例IgAN患者。患者基线肾活检及随访资料如表1所示,其中男性427例(49.3%),平均年龄34.5±9.1岁。以首次就诊为基线,平均随访时间为12.2 ± 5.5年,共访视22 533人次,平均每个患者访视26次。随访中共有260例(30.0%)患者进入ESKD,其末次随访平均eGFR为9.1 ± 3.0 mL/(min·1.73m2)。我们将所有纳入患者按照3∶1的比例,随机分为训练集(650例)和测试集(216例)。



微信图片_20241025130400.png

ESKD:终末期肾病;IgAN:IgA肾病;eGFR:估算的肾小球滤过率;T:肾小管萎缩/间质纤维化;RSA:肾素-血管紧张素系统


模型A及模型B的建立和性能评估  我们首先以肾活检为基线时刻在650例训练集的数据中建立了两个联合模型,即模型A和模型B,其生存子模型结果见表2所示。在模型A的生存子模型中,PR024H、eGFR、eGFR下降斜率以及Alb水平均与ESKD相关,而年龄、性别与ESKD无显著相关。eGFR是最重要的预测指标,eGFR每增加1个单位其ESKD风险减少18%(HR=0.82,P<0.01);eGFR每增加10个单位其ESKD风险减少86%。模型B的结果与模型A相似。尽管在以肾活检时刻为横断面的多变量COX模型中,病理学指标M、T与ESKD显著相关,然而在临床病理联合模型的生存子模型中的病理学指标M、E、S、T与ESKD的相关性均无显著统计学意义。



表2 联合模型A、B、C的生存子模型结果

表2.png

eGFR:估算的肾小球滤过率;IgAN:IgA肾病;*:eGFR斜率为当前做出预测时刻2年内的下降斜率;如访视时间<2年,则包括所有访视


在测试集中模型A与模型B的性能基本一致,二者均表现出较高的预测性能,纳入或者剔除病理学变量并未明显增加联合模型对ESKD风险预测的准确性(图1)。随着随访时间的增加,模型的预测性能持续提升,并且在肾活检第5年左右达到最佳。例如,模型A的AUC值由肾活检时刻的0.851增至肾活检第5年的0.981。在肾活检后第0~5年这六个时间点的中位AUC值为0.916。值得注意的是,更长的访视数据(5年以上)未能进一步提升模型的AUC值。模型的Brier评分变化与AUC值类似,也是在肾活检后5年左右达到最佳性能。模型A的Brier评分从基线肾活检时刻的0.114降至第5年的0.069,此后又逐渐升至第8年的0.095。更长的访视数据(5年以上)不仅未进一步降低模型的Brier评分,反而使其升高,提示模型性能下降。在肾活检后第0~5年这六个时间点的中位Brier评分为0.0969。模型A和模型B的校正曲线均在肾活检后2~4年达到最佳,预测风险与观察的实际风险一致性达到最佳。




图.png

图1 测试数据集中模型A(临床模型)与模型B(临床病理模型)的性能评估

基线t0设定为肾活检时刻;模型A与模型B均表现出较高性能,且性能几乎一致;预测起点分别为肾活检时、肾活检后1、2、3、4、5、6、7、8年;预测终点均为预测起点后10年;A:模型预测起点+10年后进入终末期肾病患者的AUC值;B:预测模型的Brier评分;C:预测模型的校正曲线


模型C的建立和性能评估  上述结果表明,联合模型能够动态高性能预测IgAN患者的肾脏预后,且剔除病理学指标不影响模型的性能。考虑到临床模型更简单、更适用于临床实践,后续的分析中我们采用了临床模型。模型A定义的基准时刻为肾活检日期,临床实际使用时需要输入肾活检日期这个变量。为进一步简化临床应用,我们将基准时刻定义为首次访视日期,并且重新拟合了临床模型C,得到的生存子模型结果与模型A相似(表2),而且其在训练集和测试集中的性能与模型A也基本一致(图2)。在测试数据集中,随着随访时间的增加,模型C的预测性能持续提升,AUC值由首次访视时的0.867提升至访视第5年的0.969(图2A),0~5年区间内模型C的中位AUC值为0.91。更长访视数据(访视第5年之后)的纳入也未能进一步增加模型C的AUC值。Brier评分也在访视第5年左右达到最佳,由首次访视时的0.111降至第5年的0.061,此后又逐渐升高至访视第8年的0.086(图2B)。模型C的校准曲线表现为在1~4年达到最佳,预测风险与观察风险较为一致,5年以后存在预测风险与观察风险存在较大的偏离。因此模型C也能够动态高性能预测IgAN患者的肾脏预后。



图2.png

图2 模型C的性能评估(临床模型,基线时刻设定为首次访视)

预测起点分别为首次访视、首次访视后第1、2、3、4、5、6、7、8年;预测终点均为预测起点后10年;A:模型预测起点+10年后进入终末期肾病患者的AUC值;B:预测模型C的Brier评分;C:预测模型C的校准曲线


个体化预测与临床应用  上述模型均能够动态高性能预测IgAN患者的肾脏预后,且预测性能在随访5年左右达到最佳预测性能,超过5年的随访数据甚至可能干扰预测模型的性能。因此在实际的临床部署中,如访视时间超过5年,我们将过滤5年以前的随访数据,仅保留5年内的数据。图3展示了预后分别为低危、中危和高危三个情况的典型病例。我们利用Rshiny包在医院局域网和互联网shinyapps网站(https://github.com/Leweibo/JM-IgAN)上部署了临床模型C,其中医院局域网内我们能够自动获得相关数据,快速为IgAN患者自动进行个体化动态预测其尿毒症的发生概率和预期肾脏生存时间。同时我们也在GitHub网站上公布了本文中的联合模型R对象以及相关源代码和数据(https://github.com/Leweibo/JM-IgAN)。



微信图片_20241025130749.png

图3 模型C的个体化预测曲线实例,分别为低危、中危和高危的情况

eGFR:估算的肾小球滤过率;PRO24H:24 h尿蛋白定量;ESKD:终未期肾病;预测图的纵向子模型仅仅显示了eGFR和PRO24H的变化情况;纵坐标为随访时间线,下方坐标轴0点为首次访视时间;上方坐标轴为预测时间,0点为当前时间;左上部分为访视期间尿蛋白变化情况的纵向拟合曲线,左下部分为访视期间eGFR的变化曲线;右侧部分为该患者的ESKD发生概率(风险)曲线,浅红色为其95%CI


讨 论


在IgAN领域,既往也存在一系列预后模型[6-7,10-11],然而无一例外这些模型都是基于横截面数据建立的。最新被改善全球肾脏病预后组织(KIDGO)推荐的国际IgAN预后预测工具也是基于横截面数据而建立的,亦未考虑到自变量随时间变化的性质,只考虑基线时点的协变量信息,这些模型均属于静态预测[6-7]。理想的预测模型应考虑这些因素随时间变化的特性,降低横截面数据的检验误差,借由动态预测提高预测准确性。相对于基于横截面数据而建立的静态预测模型,联合模型能够同时建模纵向数据和生存数据,能够正确处理检验误差(噪声)和未能完全观察到的变量。这使得其能够无偏估计纵向过程和生存过程之间的关系[9]


本研究是IgAN领域的首个联合模型,我们利用联合模型分析IgAN患者所有访视点产生的纵向数据,实现了动态预测患者ESKD的风险,达到了个体化动态预测的目标,并且获得了较高的性能。我们综合考虑了纵向随访指标(PR024H、eGFR、Alb)和生存数据之间的关系,其预测性能明显优于基于横截面数据的静态模型。以模型C为例,在基线时刻模型C实际上退化为一个横截面数据模型,此时其AUC值仅为0.867。随着随访时间的增加,模型C不断纳入纵向数据,其预测性能也持续提升,在访视第5年左右AUC值达到0.956。模型C的Brier评分也表现出类似的性质,也表明基于联合模型的动态预测模型性能优于基于横截面数据的静态模型。


随着个体化医疗的发展,对患者进行个体动态预测的需求日益增加。在临床实践中,医生往往需要综合考虑患者系列临床指标及其变化趋势,并且考虑该患者个体差异,然后再做出综合判断和预测。基于纵向数据的联合模型符合临床医生的思维方法,这一特性使得联合模型在国内外越来越流行。肾脏疾病是典型的慢性疾病,病程长,预测ESKD风险和肾脏生存时间需要动态考虑各种临床指标的变化和检验误差,因此联合模型尤其适用于肾脏疾病领域[12]。目前在肾移植领域用于预测移植肾衰竭已经较为广泛,被证明其性能明显优于传统的静态模型[13-16]。在慢性肾脏病和肾小球疾病领域,尽管联合模型也有较多的应用,但当前主要是将联合模型作为分析生物标志与疾病预后相关性的一种统计学方法,而非以建立疾病预后预测模型为主要目的[17-19]


在临床实践中,经常会出现某一项指标的缺失。基于联合模型的另外一个重要优势是能够自动处理缺失值。联合模型的纵向子模型能够利用混合线性模型,考虑个体差异预测并自动填充缺失值,使得存在缺失值的情况下模型仍然能够产生比较稳健的预测。而基于横截面数据的模型,一项指标缺失将会导致整个模型无法运行。


用于处理纵向重复测量数据和生存结局数据的联合模型的主要缺陷是分析比较复杂,需要使用到较高级的计算资源,特别是纵向预测变量较多时参数估计较困难。随着计算机硬件和计算软件包的发展,这一困难已经逐渐降低。本研究的另外一个缺陷在于联合模型本质仍是线性模型,优点是性能稳健,但对于疾病生物标志物和预后之间的非线性关系仍然难以处理。基于深度学习、人工智能等新型模型能够处理非线性关系,或将成为疾病动态预测的重要研究方向[20-22]。此外本研究没有将治疗方案这一参数纳入模型,主要原因是临床实践中治疗方案非常复杂,病程中用的是何种方案、时间剂量都难以准确获得。更重要的是,纳入治疗方案将极大地增加模型的复杂度,使本预测工具无法自动提取相关数据,将极大降低其可用性。考虑到治疗方案与PR024H、eGFR等临床指标具备高度相关性,而且模型C中5年的随访数据预测10年ESKD的AUC值已达到0.969,这一性能是可以接受的。因此,我们牺牲了部分模型的性能,以换取更大的可用性。


在临床实践中使用本研究模型时需要注意以下几点。(1)本模型是基于单中心的患者数据而建立的,未在其他肾脏疾病中心获得验证。我们将本模型的R对象公布在GitHub网站上,以期待其他中心能够验证此模型的性能。(2)任何一种疾病预测模型都是基于既往数据而建立的,肾脏疾病的治疗方法一直在进步,这些新型的治疗方法能够显著改善患者的预后。本模型是基于1997—2007年期间肾活检病例而建立的,当前钠-葡萄糖协同转运蛋白2(SGLT2)抑制剂等新型药物的广泛应用,将显著改善IgAN患者的预后,因此从这个角度来看,本模型得到的预测结果可能会比将来的实际结果更悲观。(3)对于随访超过5年的患者,我们需要先去除5年以上的随访数据。本研究表明纳入超过5年的数据不能增加预测模型的精度,相反可能干扰纵向子模型,降低预测性能。(4)本研究的终点事件为ESKD,而非肾脏替代治疗的具体时间。本研究中进入ESKD患者其末次随访平均eGFR为9.1±3.0 mL/(min·1.73 m2)。(5)对于个体而言,预测模型产生的95%CI是往往很宽的,提示每例患者的预后实际是不确定的,决定于将来的病情变化,我们预测的是该个体的期望值。如果预测的风险极大,患者肾脏中位生存时间较短,并不意味着放弃积极治疗,相反患者预后仍有很多可能,更积极的治疗或许能改变预后。


参考文献

引用本文

来源:肾脏病与透析肾移植杂志

200 评论

查看更多