基于深度学习的眼底视网膜动静脉分类方法研究
作者单位:北京建筑大学
学位级别:硕士
导师姓名:衣俊艳
授予年度:2023年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 080203[工学-机械设计及理论] 1010[医学-医学技术(可授医学、理学学位)] 0835[工学-软件工程] 0802[工学-机械工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 10[医学]
主 题:视网膜血管 眼底动静脉分类 多通道与多尺度 嵌套结构 注意力机制
摘 要:视网膜眼底血管结构是人体唯一可直接观察的内部血管系统之一。眼科医生可以通过观察眼底血管结构的变化来对各类疾病进行早期诊断,然而,由于眼底环境复杂,针对血管与动静脉的识别和对疾病的诊断具备较强的主观性,容易出现误诊情况。因此,设计一种全自动的血管分割与动静脉分类算法对于减轻医师负担与完成疾病诊断十分重要。当前,人工智能辅助医疗已成为主流,深度学习算法在各类计算机视觉任务中表现出色,尤其在图像分割和像素级分类方面有很好的效果。与传统的分割算法相比,深度学习算法拥有更好的准确性,同时由于避免了人工的特征提取与识别过程,深度学习算法拥有更强的客观性。在此背景下,本文从以下两个方面基于深度学习算法对视网膜眼底动静脉分类任务进行了研究:(1)基于多通道多尺度的动静脉分类方法研究。为了解决血管结构中尺度多变的问题,本文采用一个单U形结构的网络对特征进行提取。通过频率滤波的方法为网络引入更多有关血管网的树状的结构信息,有效增强了分割分类结果的连贯性与一致性,避免了因不完全提取造成的血管断裂与同一血管分类出错的问题。此外,为了进一步提高分类准确性,本文还设计并实现了一种针对于U形结构的特殊特征融合方法。利用U形结构的多尺度输出对复杂血管图像进行重组,有效改善了因类内与异类差异不一致导致的分类错误。与现有方法的对比实验验证了更多结构性信息的引入有利于网络对多类别进行分类这一结论的正确性。(2)基于血管分割优化的动静脉分类方法研究。本文提出了一种全新的嵌套式网络结构与基于注意力设计的模型,旨在同时解决血管分割和动静脉分类两个问题。首先,网络利用嵌套结构实现对血管的精确分割。然后,将获得的血管结构信息引入后续的动静脉分类任务中,利用结构上的连贯性和一致性与基于注意力机制而设计的特殊网络结构,获得高精度的动静脉分类结果。最后,利用前者结构获得的血管信息对后者动静脉分类任务中缺失的微血管信息进行补充,从而达到优化动静脉分类的目的。嵌套式结构有助于减小网络规模,改善过拟合和训练时间过长等问题。同时,分类和分割任务的同时进行为网络提供了额外的监督,有助于网络收敛。与现有方法的对比实验表明,该嵌套式结构具有很好的有效性,并再次验证了为网络引入更多结构信息有助于实现高精度的像素级分类。