基于深度学习的多场景虹膜分割方法研究
作者单位:东北电力大学
学位级别:硕士
导师姓名:霍光
授予年度:2023年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 080203[工学-机械设计及理论] 0835[工学-软件工程] 0802[工学-机械工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:随着身份认证需求的不断增加,虹膜识别系统逐渐应用于各种场景。虹膜分割作为虹膜识别的一个环节,其准确率直接影响识别系统的精度,其效率直接影响识别系统的性能。本文对虹膜分割中不同场景下的关键问题展开研究。针对不同问题提出相应的虹膜分割方法,主要研究内容如下:(1)面向多类型采集设备的虹膜分割:在办公地点众多的场景中,虹膜图像采集设备种类繁多,不同相机传感器拍摄的虹膜图像在分辨率、图像质量和灰度等级方面存在差异。然而,大多数虹膜分割方法通常针对一款采集设备设计,在处理上述类型的虹膜图像时,其分割性能会显著下降。针对该问题,本文提出了一个适用于多采集设备的虹膜分割网络DMS-UNet(Dropblock and Modified Shortcut branch U-Net)。在编码器部分,设计了一个改进的捷径分支结构来减少虹膜纹理、边缘及细粒度特征的丢失。在网络的编码器和解码器部分均采用了Dropblock技术,强化网络对丢失特征信息的学习,进而提高网络的泛化能力。(2)面向资源受限设备的虹膜分割:目前高精度深度神经网络通常依赖较高的计算量和较大的存储空间,无法直接部署在一些资源受限的设备上,如边缘移动设备和移动终端。为了兼顾分割的精度和效率,本文提出了一个适用于资源受限设备的虹膜分割网络ATT-LWNet(ATTention-Light Weight Net)。在网络编码器阶段初期采用空间注意力机制,在不明显增加计算成本的前提下捕获多尺度的特征信息,从而提高网络的分割精度。在解码器部分将转置卷积和插值法相结合,有效地降低网络的计算量和存储空间容量。(3)面向小样本数据集的虹膜分割:在家庭、小型实验室、小型企业等场景中,采集者数量有限导致采集的虹膜图像样本偏少。结构复杂的虹膜分割网络通常包含数百万的参数量。这类网络在小样本数据集上往往会出现过拟合现象,从而降低分割的精度。为解决该问题,本文提出一种结构简单且参数量极低的虹膜分割网络LBL-Net(Lightweight Iris Boundary Localization Network)。在编码器中,设计的多尺度上下文信息提取模块不仅能有效融合不同尺度的信息,同时能降低非虹膜区域对网络的干扰。在编码器和解码器之间设计了多级特征信息融合模块来融合深层和浅层特征。该模块能够减少网络在下采样阶段所造成的特征信息的丢失。DMS-UNet在跨数据库测试和混合数据库测试中取得良好的分割精度,证明该网络能准确地分割不同设备采集的虹膜图像。ATT-LWNet在取得较高分割精度的条件下大幅度地降低了网络的计算成本和硬件成本。与现有虹膜分割网络相比,LBL-Net在小样本数据集上以更少的参数取得更优的分割精度。