基于不同训练方法的2种人工智能系统在染色放大内镜下识别早期胃癌的能力比较
Comparison of the ability of two artificial intelligence systems based on different training methods to diagnose early gastric cancer under magnifying image-enhanced endoscopy作者机构:武汉大学人民医院消化内科消化系统疾病湖北省重点实验室湖北省消化疾病微创诊治医学临床研究中心武汉430060
出 版 物:《中华消化杂志》 (Chinese Journal of Digestion)
年 卷 期:2022年第42卷第7期
页 面:433-438页
核心收录:
学科分类:1002[医学-临床医学] 100214[医学-肿瘤学] 10[医学]
基 金:湖北省技术创新重大项目(CXZD2019000034) 湖北省卫生健康委员会创新团队项目(WJ2021C003)
摘 要:目的比较随机裁剪图片深度卷积神经网络识别模型(DCNN-C)和整张图片深度卷积神经网络识别模型(DCNN-W)2种基于不同训练方法的人工智能系统在染色放大内镜下辅助识别早期胃癌的能力。方法回顾性收集武汉大学人民医院内镜中心窄带成像和蓝激光成像2种染色放大内镜模式下的早期胃癌或非癌图片和视频片段,用于DCNN-C和DCNN-W的训练集和测试集。比较DCNN-C和DCNN-W在图片测试集中,以及DCNN-C、DCNN-W和3名高年资内镜医师(平均水平)在视频测试集中识别早期胃癌的能力。统计学方法采用配对卡方检验和卡方检验。观察者间的一致性以Cohen′s Kappa统计系数(Kappa值)表示。结果在图片测试集中,DCNN-C诊断早期胃癌的准确度、灵敏度、特异度、阳性预测值分别为94.97%(1133/1193)、97.12%(202/208)、94.52%(931/985)、78.91%(202/256),分别高于DCNN-W的86.84%(1036/1193)、92.79%(193/208)、85.58%(843/985)、57.61%(193/335),差异均有统计学意义(χ^(2)=4.82、4.63、61.04、29.69,P=0.028、=0.035、0.05);高年资内镜医师、DCNN-W和DCNN-C诊断早期胃癌的灵敏度分别为80.56%、94.44%、94.44%,差异均无统计学意义(均P0.05)。一致性分析结果显示,高年资内镜医师与金标准的一致性一般至中等(Kappa值=0.259、0.532、0.329),DCNN-W与金标准的一致性中等(Kappa值=0.587),DCNN-C与金标准的一致性极高(Kappa值=0.851)。结论当训练集相同时,DCNN-C识别早期胃癌的能力优于DCNN-W和高年资内镜医师,DCNN-W与高年资内镜医师水平相当。