壹生大学

壹生身份认证协议书

本项目是由壹生提供的专业性学术分享,仅面向医疗卫生专业人士。我们将收集您是否是医疗卫生专业人士的信息,仅用于资格认证,不会用于其他用途。壹生作为平台及平台数据的运营者和负责方,负责平台和本专区及用户相关信息搜集和使用的合规和保护。
本协议书仅为了向您说明个人相关信息处理目的,向您单独征求的同意,您已签署的壹生平台《壹生用户服务协议》和《壹生隐私政策》,详见链接:
壹生用户服务协议:
https://apps.medtrib.cn/html/serviceAgreement.html
壹生隐私政策:
https://apps.medtrib.cn/html/p.html
如果您是医疗卫生专业人士,且点击了“同意”,表明您作为壹生的注册用户已授权壹生平台收集您是否是医疗卫生专业人士的信息,可以使用本项服务。
如果您不是医疗卫生专业人士或不同意本说明,请勿点击“同意”,因为本项服务仅面向医疗卫生人士,以及专业性、合规性要求等因素,您将无法使用本项服务。

同意

拒绝

同意

拒绝

知情同意书

同意

不同意并跳过

工作人员正在审核中,
请您耐心等待
审核未通过
重新提交
完善信息
{{ item.question }}
确定
收集问题
{{ item.question }}
确定
您已通过HCP身份认证和信息审核
(
5
s)

AI研究质量如何?QUAIDE:胃肠道内窥镜AI临床前研究的质量评估

2025-07-15作者:论坛报小塔资讯
非原创


随着人工智能(AI)在医学领域的快速发展,胃肠道(GI)内窥镜已成为AI技术应用的前沿领域之一。AI在计算机辅助光学诊断(CADx)中的潜力已通过多项随机临床试验得到验证,但其临床转化仍面临挑战。现有研究在方法学、数据质量和结果报告方面存在显著差异,导致研究可重复性和普适性受限。


为此,国际多学科专家团队通过德尔菲法制定了一套专门针对胃肠道内窥镜AI临床前研究的质量评估框架——QUAIDE(Quality Assessment of pre-clinical AI studies in Diagnostic Endoscopy),旨在标准化研究设计、提升文献质量,并加速AI技术的临床应用。



研究背景与必要性



01
AI在内窥镜中的现状与挑战


AI在胃肠道内窥镜中的应用主要集中在:  


• 检测上消化道和下消化道的癌变和癌前病变,以及浅表病变的特征(计算机辅助光学诊断-cadx),主要通过组织学预测和分类/分期。


• 人工智能辅助内窥镜的潜在好处可扩展到高质量的内窥镜检查的客观认证和提供安全和高质量的治疗性内窥镜(教学+质控)。 


尽管已有商业化的实时AI系统,但多数研究存在以下问题:  


•数据偏倚:训练集多来自单中心、高质量图像(专家操作),忽略日常临床实践的多样性。  


•方法学缺陷:缺乏统一的数据分割标准(如患者级与图像级划分)、未报告验证集与测试集的独立性。  


• 结果报告不透明:选择性使用有利指标(如准确率),忽视敏感性与特异性在真实场景中的意义。


02
现有指南的局限性


尽管CONSORT-AI、SPIRIT-AI等扩展指南已为AI临床试验提供框架,但其宽泛性无法满足内窥镜AI研究的特殊需求。例如,内窥镜图像的质量受设备型号、拍摄条件(如窄带成像技术)和操作者经验影响,而现有指南未针对这些因素提出具体规范。需要标准化规范研究过程及术语。

QUAIDE框架的构建方法 



1.png


研究团队通过德尔菲法汇集32位来自内窥镜临床、计算机科学和方法学领域的专家,历经三轮匿名投票,最终达成18项共识声明,覆盖六大核心领域:  


1. 数据获取(Data Acquisition) 


声明1:需完整描述数据采集环境(如医疗机构类型)、技术参数(内窥镜型号、图像格式)及操作者资质。  


声明2:确保数据异质性,涵盖不同质量的图像和完整疾病谱(如巴黎分类下的各类结直肠病变)。  


声明3:测试集应基于患者而非单张图像或病变选择,以避免数据泄漏。  


声明4:图像/视频采集的技术信息(内窥镜、图像增强内窥镜、采集设备)必须提供,包括图像/视频文件类型、所使用的压缩标准和预处理。


2. 标注与参考标准(Annotation & Ground Truth)  


声明5:明确标注的参考标准(如病理结果或专家共识),并引用学会指南支持(共识率100%)。  


声明6:标注需由多位注释者完成,注明其专业背景(如内窥镜经验年数),以减少主观偏倚(共识率96%)。  


3. 结果指标(Outcome Metrics)  


声明7:人工智能研究的结果参数应该得到很好的描述,并与临床相关终点相关。


声明8:使用公认指标(敏感性、特异性、ROC曲线),并提供原始数据(如混淆矩阵)(共识率96%)。  


声明9:将AI性能与不同经验水平的内窥镜医师对比,明确临床增量价值(共识率96%)。  


4. 实验设计(Experimental Setup)  


声明10:训练集、验证集与测试集需独立分割,优先采用患者级交叉验证(共识率100%)。 


5. 算法架构(Algorithm Architecture  


声明11:基本的算法架构和具体的设计选择应该被明确地描述。 


声明12:报告过拟合检测方法(如正则化技术、数据增强)(共识率96%)。  


声明13:在附录中提供算法技术细节,确保可复现性(共识率100%)。  


6. 结果解释与讨论(Interpretation & Discussion)  


声明14:人工智能系统的诊断特性(和比较器,如人工基准)的测试集。


声明15:应报告训练/验证/测试集中的疾病患病率。


声明16:应提供模型开发中使用的图像/视频示例,以及展示系统如何用于临床实践的图片(最低要求)/视频(理想要求)。


声明17:应(简要)总结特定CAD应用程序的现有证据。


声明18:分析AI系统的局限性(如对低质量图像的敏感性)、临床适用性及潜在危害(如过度诊断)(共识率96%)。


2.png
3.png
4.png
5.png

与其他指南的衔接

QUAIDE并非孤立框架,而是与现有AI医学研究指南形成互补:  

  • 临床前阶段:使用QUAIDE评估算法开发与离线验证。  

  • 早期临床评估:采用DECIDE-AI报告实时临床性能。  

  • 大规模临床试验:遵循SPIRIT-AI设计试验方案CONSORT-AI报告结果。  

例如,针对结直肠息肉CADe系统,QUAIDE指导数据标注与验证,而SPIRIT-AI则用于设计后续随机对照试验。

结论



QUAIDE框架的提出标志着胃肠道内窥镜AI研究向标准化迈出了关键一步。通过多学科共识形成的18项声明和配套工具,不仅为研究者提供了具体操作指南,也为期刊编辑、评审专家和监管机构建立了统一评估基准。


随着AI在内窥镜中的应用从“技术展示”转向“临床实用”,QUAIDE有望成为推动这一转变的核心方法论,最终实现AI技术安全、高效地服务于患者。


9da16c071b569bf14d515fc1b69175c.png

作者:吴姗

吴姗.png

来源:宜山论镜

END



200 评论

查看更多