基于深度学习算法的病理学图片淋巴细胞浸润检测
Deep learning-based lymphocyte infiltration detection on pathological images作者机构:复旦大学附属肿瘤医院放射治疗中心复旦大学上海医学院肿瘤学系上海市放射肿瘤学重点实验室上海市放射治疗临床医学研究中心上海200023
出 版 物:《中国癌症杂志》 (China Oncology)
年 卷 期:2024年第34卷第4期
页 面:409-417页
核心收录:
学科分类:1002[医学-临床医学] 100214[医学-肿瘤学] 10[医学]
摘 要:背景与目的:深度学习方法可用来在病理切片上开展淋巴细胞的自动分割和检测。本研究探讨使用变分自编码模型预训练的方法对病理学图片进行淋巴细胞浸润检测的性能,以及去除肿瘤坏死区域对模型性能的影响。方法:使用变分自编码模型(variational auto-encoder,VAE)先在来自肿瘤基因组图谱(the Cancer Genome Atlas, TCGA)数据库中的无标注的TCGA-COAD和TCGA-READ病理切片图像上进行预训练,获得一个自编码预训练模型,再在已标注淋巴细胞的公开数据集上进行淋巴细胞浸润检测的模型训练。为避免与坏死的区域相混淆,还训练了分割肿瘤坏死区域的Unet模型,以去除肿瘤坏死区域对淋巴细胞识别的影响。分析经过变分自编码模型预训练的淋巴细胞浸润检测模型在训练集和测试集上的受试者工作特征曲线(receiver operating characteristic curve,ROC)的曲线下面积(area under curve,AUC)及其95%置信区间(confidence interval,CI)。结果:检测模型在训练集上AUC为0.979(95%CI:0.978~0.980),准确率为92.5%(95%CI:92.3%~92.6%),Kappa值为0.849,灵敏度为0.908,特异度为0.941,精确率为0.939,召回率为0.908,F1为0.923。验证集的AUC为0.968(95%CI:0.964~0.972),准确率为91.3%(95%CI:90.6%~92.0%),Kappa值为0.826,灵敏度为0.898,特异度为0.928,精确率为0.925,召回率为0.898,F1为0.912。Resnet18模型在已标注的数据集上直接训练的结果为:验证集的准确率为83.2%(95%CI:82.2%~84.1%),Kappa值为0.664,灵敏度为0.823,特异度为0.840,精确率为0.838,召回率为0.823,F1为0.830。分割肿瘤坏死区域的Unet模型最终在训练集上的DICE值为0.78,在验证集上为0.76。去除坏死区域后本文提出的变分自编码模型预训练的淋巴细胞浸润检测模型的预测性能获得了一定的提升,在验证集上的AUC从0.968(95%CI:0.964~0.972)提升至0.971(95%CI:0.968~0.975)。准确率为92.4%(95%CI:91.7%~93.0%),Kappa值为0.849,灵敏度为0.928,特异度为0.921,精确率为0.921,召回率为0.928,F1为0.925。结论:采用变分自编码模型预训练的方法,对淋巴细胞浸润的病理学图片进行浸润检测,可获得比直接训练更优的模型表现;并且通过Unet去除肿瘤坏死区域的影响能够进一步提高模型的性能。