查看更多
密码过期或已经不安全,请修改密码
修改密码壹生身份认证协议书
同意
拒绝
同意
拒绝
同意
不同意并跳过
呼吸道病毒是全球范围内急性呼吸道感染(ARI)的主要病因。为进一步探索呼吸道病毒感染与气候因素的复杂联系,准确预测呼吸道病毒的传播风险,助力制定更有效的疾病防控策略,广州呼吸健康研究院杨子峰教授团队联合金域医学团队、广州医科大学金域检验学院广东省感染性疾病智能化诊断技术工程研究中心、广州市传染性疾病临床快速诊断与预警重点实验室曾志奇博士结合气象环境数据与机器学习方法,开发了一种全新的呼吸道病毒感染风险预测模型,为呼吸道病毒的早期预警和防控提供了有力的科学依据。
2月3日,该研究成果以“Development of a respiratory virus risk model with environmental data based on interpretable machine learning methods”为题在气候学和大气科学领域国际顶级学术期刊、地球科学领域三大Nature子刊之一的《npj Climate and Atmospheric Science》(Q1,5年影响因子:9.7)发表。
近年来,大量研究探讨了大气环境因素与呼吸道病毒感染之间的关系。但现有研究在数据规模、地域覆盖及病原体多样性方面存在显著局限。本研究旨在通过机器学习方法开发一个全国性的呼吸道病毒感染风险预测模型。
我们采用了CRFC算法,一种基于随机森林的多标签分类方法,用于预测多种呼吸道病毒的存在。该模型整合了每个病毒类别的二分类结果,并结合了空气质量和气象数据以提高其准确性。数据收集来自2016年至2021年间中国31个地区,涵盖病原检测、空气质量指数和气象测量数据。模型性能通过ROC曲线、AUC分数和精准率-召回率曲线进行评估。
模型在各项指标上均表现出色,平均整体准确率为0.76,宏观灵敏度为0.75,宏观精准率为0.77,平均AUC分数为0.9。基于SHAP框架的模型可解释性分析表明,年龄、二氧化氮浓度及气象条件等参数对预测结果具有重要贡献。本研究建立的模型实现了环境数据与临床信息的深度融合,为呼吸道病毒风险评估提供了可靠工具,其性能指标显示在临床决策和公共卫生规划中具有应用潜力。后续研究将重点优化模型架构并拓展其在不同人群和地域的适用性。
该研究通过整合全国呼吸道病毒检测数据与环境因素,构建了基于链式随机森林分类器(CRFC)的机器学习模型,揭示了气候变化与呼吸道病毒感染风险的复杂关系。研究创新地采用可解释性机器学习(SHAP框架),解析了NO₂浓度、气温、年龄等关键驱动因子,为病毒传播机制的研究提供了量化依据。同时,开发的多标签分类模型突破了传统单一病毒预测的局限,兼顾高精度与可解释性,推动了多病原体感染联合预警的技术发展。此外,模型具备时空扩展性,能够评估不同地区和人群的感染风险,在应对季节性流行病与新发传染病中具有显著潜力。
杨子峰,广州医科大学广州呼吸健康研究院副院长,广州医科大学呼吸疾病全国重点实验室副主任,广州国家实验室诊断技术创新研究与转化中心主任,澳门科技大学“大规模呼吸疾病流行病预测预警与医学大数据人工智能应用实验室”联合主任。世界卫生组织H7N9、H5N1风险评估组专家/全日本流感学会会员,第十六届广州市人大代表,国家药监局重点实验室大湾区生物药监管科学与转化研究中心副主任,中华中医药学会科学技术奖中青年创新人才奖、广州高层次领军人才。牵头构建了呼吸道病原临床监测网,并在新冠期间开展新冠病毒的监测与疫情预测预警工作,创建了基于多元异构数据精准预测模型的传染病监测与预测预警平台,牵头成立基于时空分布模型及舆情语言大模型的大规模流行病的预报和预测系统及应用示范研究协作组,推动大规模流行病的时空分布与多元数据预测模型研究。承担科研项目逾20项;发表SCI研究论文70篇;3篇论文入选ESI高被引。曾获国家科学技术进步奖创新团队奖(核心成员)、广东省科技进步特等及一等奖(核心成员)、全国创新争先奖牌(核心成员)、中国专利优秀奖和药明康德生命化学奖学者奖等多项科研奖励。
查看更多