查看更多
密码过期或已经不安全,请修改密码
修改密码
壹生身份认证协议书
同意
拒绝
同意
拒绝
同意
不同意并跳过
专家论坛
人工智能在乳腺癌影像和病理组学整合诊断中的进展
刘晶晶, 徐小童, 张怡, 张瑾
(天津医科大学肿瘤医院)
摘要
乳腺癌是全球女性最常见的恶性肿瘤,发病率逐年上升,早期诊断对改善患者预后至关重要。近年来,人工智能(artificial intelligence,AI)技术成为乳腺癌诊断领域的变革性工具,其在乳腺癌筛查、多模态影像诊断、病理诊断以及治疗与预后等领域的研究进展,为乳腺癌的精准诊断和预后评估提供了新方向。同时近年来,人工智能通过机器学习和深度学习算法,在提高诊断准确性、效率和可访问性等方面展现出显著优势,如提升小病灶检出率、减轻医生工作负担、优化治疗决策等。尽管面临可解释性技术临床转化困境、数据标准化建设系统性缺失、多模态数据治理困境与模型泛化风险等挑战,人工智能仍有望在乳腺癌的精准诊断和智能化诊疗中发挥更大作用,推动“精准医疗”目标的全面落地。
乳腺癌作为全球女性最常见的恶性肿瘤,其疾病负担持续加重,据2022年全球癌症统计数据显示,乳腺癌新增病例达230万例,占所有新发恶性肿瘤的11.6%,位居女性恶性肿瘤首位[1]。该病的病理学本质是乳腺上皮细胞的异常增殖,其临床表现具有高度异质性,包括乳房不对称性改变、组织结构扭曲、微钙化(microcalcification,MC)以及形态各异的占位性病变[2]。乳腺癌的早期结构异常(如微小钙化、微小肿块、结构扭曲、不对称性和微小血管生成)在常规检查中可能难以发现,早期诊断对改善患者预后至关重要,早期乳腺癌5年生存率可达83.2%,晚期乳腺癌5年生存率仅20%[3],凸显了提升早期检出率的临床迫切性。目前通过多种检查方法的联合应用、人工智能(artificial intelligence,AI)辅助诊断以及新技术的引入,可以显著提高这些病变的检出率。AI已成为乳腺癌诊断领域的变革性工具,其利用机器学习(machine learning,ML)和深度学习(deep learning,DL)算法来提高准确性、效率和可访问性。数字乳腺X线摄影(digital mammography,DM)、数字乳腺断层合成(digital breast tomosynthesis,DBT)、超声和磁共振成像(magnetic resonance imaging,MRI)中的AI应用已显示出更高的灵敏度和特异性,减少了不必要的假阳性召回,还通过自动化分析减轻了放射科医师的工作负荷[4]。未来,随着多模态数据融合技术的发展,AI有望进一步推动乳腺癌的精准化诊疗进程。
01
AI在乳腺癌筛查中的应用
1.1 AI在乳腺X线筛查中的检测性能和特征分析
乳腺X线检查作为乳腺癌筛查与诊断的关键影像学手段,借助低剂量X射线穿透乳房,将内部结构成像,进而清晰呈现肿块、钙化点等异常,助力早期乳腺癌的发现。乳腺组织的复杂性以及病变表现的多样性,使得即使经验丰富的放射科医师,在病变识别与精准解读上也面临挑战。微小病灶易被忽视,不同类型病变的特征区分困难,均可能导致漏诊或误诊,尽管多国指南均推荐了双重阅片程序,但仍存在间期癌漏检问题,这一临床痛点为AI的应用提供了重要契机。
Hernström等[5]开展乳房X光检查人工智能筛查试验(MASAI),在瑞典西南部4个筛查点招募105 934名女性,采用1:1随机分组设计比较AI辅助筛查与传统双读筛查的效能。干预组的检查结果使用AI系统进行分析,设定基于恶性风险评分(1~10分),其中低风险(1~7分)、中等风险(8~9分)与高风险(10分)。低风险和中等风险的检查进行单次阅读,而高风险的检查进行双次阅读。对照组的筛查不使用AI分析,而是进行了标准的双次阅读。AI组恶性肿瘤检出率为6.4%,显著高于对照组的5.0%(RR=1.29,95%CI:1.08~1.52);在保持召回率(7.6% vs. 7.7%)和假阳性率(2.0% vs. 2.1%)相当的情况下,AI组阳性预测值显著提升(29.3% vs. 24.6%);AI组检出的恶性肿瘤以早期(T1期68%)、淋巴结阴性(N0期82%)的浸润性癌为主;AI辅助使放射科医师工作量减少44.2%。该研究首次通过高水平循证医学证据证实,与标准双人阅片相比,AI支持的阅片程序显著提高了恶性肿瘤检出率,同时未增加假阳性率,并降低了阅片工作量,优化筛查阅片流程,具有重要的临床转化价值。
乳腺密度是患乳腺癌的风险因素之一。在乳腺密度更高的亚洲人群中,与单纯人工阅片相比,结合AI辅助能否有效提升乳腺癌的筛查诊断效能?AI-STREAM研究作为一项具有代表性的在亚洲人群的前瞻性多中心队列研究,系统评估了AI-CAD(computer aided diagnosis)在临床实践中的应用价值,比较了放射科医师在标准单次阅片时,使用与不使用AI-CAD辅助的诊断效能差异。其从韩国国家乳腺癌筛查项目中选取了6所学术医院年龄≥40岁的女性作为研究对象,共有25 008名女性接受了常规乳腺X光筛查,最终24 543名参与者被纳入研究队列,其中67.5% 研究对象乳房致密,在确诊的乳腺癌患者中,80.7%乳房致密。使用了云基成像数据管理平台(IRM’s BEST image)和Snupi程序对乳腺X光图像进行处理和管理。同时,采用了商业AI-CAD系统(Lunit INSIGHT MMG)辅助诊断,该系统会根据乳腺X光图像为每个乳房提供0~100分的异常评分,当异常评分高于预设的10分则判定为阳性结果。研究结果显示:1)AI-CAD辅助组诊断敏感性提升:干预组的癌症检出率(cancer detection rates,CDRs)较对照组显著提高13.8%(P<0.001);2)筛查特异性维持:两组间的召回率(recall rates,RRs)保持稳定(P=0.564),AI辅助未增加不必要的活检负担;3)AI-CAD辅助组早期病变检出优势:干预组特别提高了对预后良好型乳腺癌的检出率,包括:小肿瘤(直径<20 mm),淋巴结阴性病例,Luminal A分子亚型[6]。这些发现证实,在单次阅片工作流程中整合AI-CAD系统,可在不增加假阳性率的前提下,显著提升早期乳腺癌的检出效能。该研究为AI-CAD在亚洲人群乳腺癌筛查中的临床应用提供了前瞻性的循证医学证据,对优化现有筛查策略具有重要指导意义。
从技术优势层面来看,AI在乳腺X线检查中的应用,有效提升了小病灶的检出率。其能够精准捕捉影像中细微的异常信号,减少人为疏忽导致的漏诊。此外,AI还极大减轻了放射科医师的工作负担,使其从繁重、重复性的读片工作中解脱,将更多精力投入复杂病例研判[5]。
目前AI在乳腺X线检查应用中也存在一定局限性:1)医学影像数据的标准化程度不足,不同设备、不同医院获取的乳腺X线影像在格式、参数、成像质量等方面存在差异,影响AI模型训练与应用的稳定性和通用性。2)实现多模态数据的有效整合难度较大,限制了AI全面、精准分析病情的能力。未来,随着技术的不断发展和研究的深入,有望进一步优化AI系统,克服现有研究的局限性,为全球女性的乳腺健康保驾护航。
1.2 AI助力乳腺超声筛查效能
乳腺超声凭借无辐射、无创的特性,成为检查乳腺结构异常的重要手段,在乳腺癌筛查与诊断领域发挥着关键作用。然而,常规的乳腺超声检查采用人工操作方式,即由超声医师或技师手持探头在乳腺区域进行扫描。这种检查模式下,对乳腺结构异常的诊断结果在很大程度上取决于医师的临床经验,存在较强的主观性。此外,由于超声影像诊断技术本身的灵敏度有待提升,在识别小病灶、检测微钙化等方面存在一定的技术瓶颈,影响了诊断的准确性和全面性[7]。
自动乳腺超声诊断系统(automated breast ultrasound system,ABUS)作为先进工具,通过自动化设备对乳腺进行标准化扫描,辅助乳腺疾病诊断。其提高了检查的一致性,在乳腺癌筛查和诊断中表现出色。然而,ABUS生成的3D图像包含海量信息,医师需逐层分析每张切片图像,并结合三维视角综合判断,这使得分析时间大幅增加,可能导致诊断效率下降[8]。
针对ABUS的这一弊端,AI的融入显得至关重要。AI与ABUS的结合,以高度标准化的方式采集整个乳房的图像具有优势,且不仅能够有效缩短医师的阅片时长,还能显著提升对病灶的检出率。对减轻放射科医生压力、提高诊断准确性意义非凡[9]。有研究提出基于3D DETR(detection transformer)架构的模型,用于3D ABUS图像中乳腺病变的检测。该模型结合多视图共注意力机制(multi-view co-attention mechanism,MCAM)和无监督多视图对比学习(unsupervised multi-view contrastive learning,UMCL),模拟超声医师诊断时的多视图分析方法,有效提升了在复杂乳腺病变中的检测能力[10]。
Kwon等[11]评估影像科医生使用AI-CAD应用于ABUS中检测可疑病变的诊断性能,由2名超声科医师审查图像并确定乳腺影像报告和数据系统(breast imaging reporting and data system,BI-RADS)类别。使用AI-CAD将ABUS图像分类为阳性或阴性。BI-RADS类别通过4种方式重新调整:医生根据AI结果修改BI-RADS类别(AI辅助1);基于AI结果升级或降级(AI辅助2);仅对阳性结果进行升级(AI辅助3);仅对阴性结果进行降级(AI辅助4)。比较了AI辅助诊断与仅影像科医生诊断的表现及AI-CAD阳性与AI-CAD阴性癌症的特征。在262个病灶中,仅影像科医生诊断的受试者工作特征曲线下面积(area under the curve,AUC)为0.870(95%CI:0.832~0.908)。使用AI辅助后,AUC提高到0.919(95%CI:0.890~0.947),且差异具有统计学意义(P=0.001),充分表明AI辅助显著提升了超声科医师的诊断准确性。
02
AI在多模态影像诊断中的突破
乳腺癌的早期精准诊断对预后至关重要,多模态影像技术(如超声、钼靶、MRI等)的联合应用已成为乳腺癌诊断的重要方向,而AI的深度介入则为该领域带来革命性突破。
在超声诊断层面,AI通过卷积神经网络(convolutional neural network,CNN)等算法对乳腺超声图像的纹理、形态特征进行多模态自动化分析,显著提升微小乳腺癌病灶和微钙化的检出率[12]。可通过标准化采集全乳腺三维数据,并利用MCAM模拟医师多视角分析逻辑,AI系统进一步增强了复杂乳腺病变的检测能力[9]。研究还显示,AI辅助多模态超声系统在乳腺癌腋窝淋巴结转移预测方面表现出色,AUC可达0.799,准确率达88.9%,值得注意的是,该系统在特异性和阳性预测值方面均实现了100%的优异表现,为临床无创评估淋巴结状态提供了可靠的辅助工具[13]。
在钼靶和乳腺核磁领域,AI的突破集中于影像组学特征提取与多模态数据融合。通过深度学习模型对钼靶图像的肿块边缘、密度及钙化模式进行量化分析,AI可辅助鉴别良恶性病变,部分模型诊断准确率已超过90%[14]。针对MRI动态增强序列,AI通过时空特征建模,能够精准识别肿瘤血流动力学差异,结合表观扩散系数(apparent diffusion coefficient,ADC)图像等功能影像信息,进一步提升早期乳腺癌的检出率和分子分型预测精度。多模态融合模型通过整合超声、钼靶、MRI的互补信息,构建跨模态特征关联网络,显著降低单一模态的诊断的局限性,在淋巴结转移预测、新辅助疗效评估等场景中展现出更高的敏感度和特异性[15],对直径≤5 mm小病灶和微钙化簇的识别敏感度显著提升[16]。
尽管当前多模态AI模型在数据标准化、泛化能力及临床可解释性方面仍存在挑战,但其在乳腺癌多模态影像诊断中的突破性进展,已初步展现出从“辅助工具”向“精准诊断核心技术”的角色转变。此外,AI驱动的影像基因组学研究正逐步实现“影像-基因-临床”的跨层关联,通过影像特征预测HER2表达状态、Ki-67增殖指数等分子标志物,为个性化治疗方案制定提供前瞻性依据[17]。
未来,随着多中心数据共享、跨模态预训练模型及实时影像分析技术的发展,AI有望构建更完善的乳腺癌智能诊断体系,推动“精准医疗”目标的全面落地。
03
AI助力乳腺癌病理诊断
病理学检查作为乳腺癌诊断的“金标准”,通过显微观察组织样本确定肿瘤性质与类型。随着AI技术的深入应用,传统病理分析正经历革命性变革。基于机器学习的全切片图像(whole slide imaging,WSI)组织学形态分析,是AI在病理领域广泛的应用方向,尤其在多模态模型构建与临床验证中展现出显著优势[18]。
3.1 新型AI工具优化WSI分析
针对WSI的AI工具在乳腺癌预后风险评估中已取得实质性突破。Boehm等[19]开发的Orpheus多模态深度学习模型,创新性融合图像数据与文本报告,通过Transformer和BERT技术实现跨模态特征融合,精准评估病理特征与预后。研究纳入6 172例HR+/HER2−早期乳腺癌患者的3个独立队列(MSK-BRCA、IEO-BRCA、MDX-BRCA),结果显示在MSK-BRCA测试集的TAILORx风险分类中,Orpheus模型较单一模态(仅WSI或文本报告)表现更优,远超传统21基因复发评分(oncotype DX recurrence score,ODXRS),尤其在低风险患者(ODXRS≤25)的高风险疾病识别中,其AUC达0.88,证实其在复发评分推断及风险分层中的显著优势。
另一款获CE-IVD认证的Stratipath Breast工具,通过分析H&E染色WSI实现预后风险分类。Sharma等[20]对2 719例原发性乳腺癌患者的多中心验证显示,在ER+/HER2−亚组中,该工具能有效区分高低风险患者,风险比(HR)分别达2.76和2.20,具备独立预后价值。其快速、低成本的特性,为辅助化疗决策优化提供了高效解决方案,有望扩大临床受益人群。
3.2 新型AI多模态病理模型的开发和应用
Orpheus模型的突破性在于构建了整合组织形态学与分子分型信息的多模态框架。通过深度挖掘WSI中的组织学特征(如肿瘤细胞密度、核异型性)与病理报告中的文本数据(如免疫组织化学结果、临床分期),模型实现了对传统分子标志物(如21基因评分)的超越。在HR+/HER2−这一乳腺癌最常见亚型中,该模型不仅精准识别被传统方法低估的高风险患者,更通过跨模态数据融合,为个体化治疗方案制定提供了多维证据支持。这种将形态学表型与分子分型深度结合的模式,标志着AI从单一图像分析向多维度病理信息整合的进阶,为风险分层提供了更全面的评估体系。
最近一项研究成果展示了一种基于WSI和临床病理特征的多模态预测模型等[21]。该模型通过ACMIL和CLAM两种深度学习管道整合组织特异性特征编码器与注意力机制,在1 095例患者队列中实现五重交叉验证平均AUC为0.86±0.02,外部验证AUC达 0.80±0.04,显著优于单纯临床病理模型。该模型显著提高了预测性能,为个性化治疗和精准医疗提供了一种新工具。特征编码器和可解释性的进一步优化将促进深度学习技术在病理图像分析中的广泛应用,并推动精准肿瘤学领域的发展。
AI技术正从效率提升走向精准诊断的核心环节,通过全切片图像分析的临床验证与多模态模型的创新构建,重塑乳腺癌病理诊断的金标准。随着高质量数据积累与算法优化,AI有望进一步渗透病理诊断全流程,推动乳腺癌诊疗向精准化、智能化迈进,为患者提供更精准的预后评估与治疗决策。
04
AI在乳腺癌治疗反应和复发风险预测中的整合应用
4.1 多模态AI模型在新辅助治疗反应预测中的尝试
新辅助治疗(neoadjuvant therapy,NAT)作为局部晚期乳腺癌的标准疗法,其疗效评估对避免无效治疗毒性及优化手术时机至关重要[22]。为此,研究开发了可解释的多模态融合模型(multi-modal response prediction,MRP),通过整合纵向影像(乳腺X线、MRI)、病理特征与临床数据,构建动态疗效预测框架[23]。模型集成跨模态知识挖掘和时间信息嵌入策略,有效处理模态缺失问题并降低不同NAT方案的影响,在3 000余例患者队列中展现出对病理完全缓解(pathological complete response,pCR)的精准预测能力。在治疗前(Pre-NAT)阶段,MRP以零漏诊pCR病例为前提,准确识别出35.8%的非pCR病例,减少不必要的治疗暴露;治疗后阶段,模型筛选出16.7%的pCR病例可考虑缩减手术范围,同时识别37% 的非pCR患者需调整治疗方案,且未引入额外预测误差。与放射科医师相比,MRP预测准确性显著提升。
此外,另有研究通过构建深度学习影像组学(deep learning radiomics,DLR)模型,整合治疗前与治疗早期的多时间点影像特征及临床信息,其联合预测模型在训练集和验证集的AUC分别达0.914和0.925,为NAT患者的疗效预判提供高效工具[24]。
4.2 多组学数据整合的CIMPTGV模型预测复发风险
HR+/HER2−乳腺癌患者虽对内分泌治疗敏感,但仍面临持续复发风险(年复发率约1%)。Zhang等[25]开发的CIMPTGV模型,整合临床信息、免疫组化、代谢组学、病理组学、转录组学、基因组学及拷贝数变异等多组学数据,通过机器学习构建复发风险预测框架。该模型在训练集和测试集的一致性指数分别达0.871和0.869,显著优于OncotypeDX、MammaPrint等单模态模型及CIT、CT等多模态组合模型,能够有效区分高/低复发风险群体。多模态数据的协同互补特征整合,显著提升了复发风险预测准确度。CIMPTGV模型通过挖掘多维度生物信息,为HR+/HER2−乳腺癌患者的临床风险分层与精准治疗决策提供了更高效的工具,凸显了多模态机器学习在解析肿瘤生物学特征中的潜力。
05
挑战与未来方向
5.1 可解释性技术的临床转化困境
AI在肿瘤学领域的研究进展备受关注,然而正面临诸多挑战。当前AI在乳腺癌影像分析中的核心技术瓶颈集中于可解释性不足、数据标准化缺失与跨模态泛化能力受限。尽管AI模型(如多模态融合算法)在乳腺癌诊断中展现出高于传统方法的精度,但其决策逻辑常依赖黑箱式深度学习架构,导致病理医师难以追溯特征权重与诊断依据,这一缺陷显著制约了临床信任度的建立[26]。针对这一现状,研发可解释性AI技术、构建透明化模型架构成为破局关键[27]。通过引入基于注意力机制的可视化工具,将模型关注的影像特征及其权重直观呈现,同时开发结合规则引擎与深度学习的混合模型,以医学规则约束决策路径,确保诊断既精准又符合临床指南。
5.2 数据标准化建设的系统性缺失
数据层面,不同机构间影像采集参数(如乳腺X线的曝光剂量、MRI的序列协议)缺乏统一标准,且多模态数据(X线、超声、MRI)的空间配准与特征对齐存在技术壁垒,导致模型在跨中心应用时泛化能力下降。由于数据及其标注缺乏统一标准与规范化,这使得机器学习算法在处理数据时的复杂度大幅提升,同时也对机器与数据之间的顺畅交互形成了阻碍[28]。不同医院的信息化平台因厂商标准不一导致数据结构碎片化,而省域间医保政策、患者隐私保护细则的差异进一步加剧了数据流通的制度性障碍。如何在保障数据安全合规的前提下打破“数据孤岛”,建立跨机构、跨区域的医疗数据可信流通机制,已成为医疗AI能落地与精准医学发展的关键瓶颈[29]。这一挑战的破局需依赖全国统一的医疗数据标准化体系,制定涵盖影像采集、数据标注、接口规范等全流程的国家标准,形成标准化数据资源池,为AI模型的持续优化提供高质量数据支撑,推动精准医学从单中心研究向全人群应用的跨越[30]。
5.3 多模态数据治理困境与模型泛化风险
肿瘤学研究依赖大量多模态数据,但其获取、存储与共享存在安全性、隐私保护、标准化及质量等方面的难题。模型在新数据上的泛化能力通常不足,尽管大型数据集有助于捕捉训练和验证过程中的变异性,但多数通过常规临床护理被动收集的大型数据集存在数据漂移、过拟合等隐藏问题,导致模型在外部数据中的准确性难以预测。此外,模型可能依赖数据中的捷径特征而非真正的医学信号,进一步削弱了其泛化能力[31]。建立多模态数据质量评估与治理体系,在数据采集阶段引入自动化质量控制工具,剔除低质量数据;采用主动学习技术,通过医学专家标注高价值数据样本,提升数据标注的准确性和一致性。针对模型泛化问题,开发基于迁移学习和元学习的算法,使模型能够快速适应新环境的数据分布;构建多任务学习框架,利用不同模态数据的互补性增强模型鲁棒性,减少对捷径特征的依赖[32-33]。
06
结语与展望
未来乳腺癌诊疗的AI应用需在技术革新与生态构建中实现深度突破:技术研发中,重点突破可解释性AI模型瓶颈,开发基于注意力机制的可视化工具,将模型决策逻辑转化为临床可理解的特征热力图,切实解决“黑箱”模型的信任痛点。临床场景中,着力推进AI在乳腺癌筛查“精准分层”应用,依托AI对乳腺密度智能评估及个体风险动态评分体系,实现筛查频率与手段的个性化调整,构建“风险导向型”筛查新模式。数据生态建设上,亟须建立跨机构多模态标准化数据库,整合影像、病理、基因等多维数据形成高质量临床队列,为AI模型泛化能力验证提供标准化支撑平台。政策伦理方面,需明确AI辅助诊断的决策权重边界,对高风险病例(如AI提示恶性可能的微小结节)建立双人复核机制,同时完善数据脱敏、匿名化等隐私保护技术框架,确保跨机构数据流通合规。这些方向的协同突破,将推动AI从辅助工具升级为精准医疗核心引擎,助力乳腺癌诊疗向智能化、个性化跨越。
专家介绍
张瑾 教授
天津医科大学肿瘤医院
二级教授、主任医师,博士研究生导师。现任中国天津乳腺癌防治研究中心常务副主任、天津医科大学肿瘤医院乳腺肿瘤三科主任。荣获国务院政府特殊津贴专家、天津市劳动模范、第四届“国之名医”荣誉称号获得者。兼任欧洲肿瘤内科学会乳腺癌专家委员会委员、中国抗癌协会常务理事、中国抗癌协会乳腺癌专业委员会主任委员、中国抗癌协会整合乳腺癌委员会副主任、中国抗癌协会整合外科治疗委员会副主任、中国抗癌协会肿瘤多学科诊疗(MDT)专业委员会副主任委员、中华医学会肿瘤学分会委员、中华医学会肿瘤学分会恶性肿瘤早诊早治学组副组长、中华医学会外科学分会乳腺癌学组委员、中国医师协会外科医师分会乳腺外科专家工作组副组长、中国医师协会肿瘤多学科诊疗(MDT)专家委员会常委、天津市医学会肿瘤学分会主任委员、天津市抗癌协会主任委员、天津市乳腺癌质控专家委员会主任。从事乳腺肿瘤外科工作36年,带领中国天津乳腺癌防治研究中心落实乳腺癌精准多学科诊疗全过程并对患者率先实现全生命周期健康管理,在国内最早开展乳腺癌保乳手术和前哨淋巴结活检技术,提高患者的生存质量。牵头及参与多项国际、全国多中心临床研究,牵头国内首个帕妥珠单抗上市临床试验。发表论文近200篇,SCI 70余篇,国际会议POSTER 30余篇,先后承担和参加国家级和省部级科研课题40余项。现主持国家自然科学基金项目2项,主持和参加天津市重大科技专项等课题多项,曾获天津市科技进步二等奖2项、天津市科技进步三等奖3项。
来源:中国肿瘤临床
查看更多