基于S4Net的显著实例分割方法研究
作者单位:天津财经大学
学位级别:硕士
导师姓名:何丽
授予年度:2022年
学科分类:08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程]
主 题:显著实例分割 边界细化 边界-分割联合训练 注意力机制 特征增强
摘 要:近年来,随着人工智能技术的发展和应用的逐渐推广,很多新兴的计算机视觉任务也在不断产生和发展,而显著实例分割就是其中一个。显著实例分割是由显著性检测和实例分割两大任务衍生而来,主要是通过对视觉上具有显著性的物体进行检测,并对检测到的显著性物体进行像素级分割,获得感兴趣的实例类,从而对显著性物体实现实例间的区分。因此,如何更好地定位显著性物体和分割显著实例是显著实例分割任务的关键。本文以ResNet50为基础网络,利用S4Net的显著实例分割方法,围绕如何解决显著实例分割中边界信息丢失和显著目标检测中定位不准确的问题展开相关研究工作。本文的主要工作如下:1.提出了一种融合多尺度边界特征的显著实例分割模型。S4Net模型利用目标对象和其周围背景的特征分离能力,提出了Ro IMasking来提升分割精度。但该方法忽视了卷积神经网络自身的特性,多次的卷积和上采样会造成实例边界信息缺失。因此,本文在S4Net的基础上,提出了一种结合边界特征的端到端显著实例分割方法。该方法设计了一个多尺度融合的边界特征提取分支,利用边界细化模块来强化对实例边界信息的提取;同时,提出了一个新的边界-分割联合损失函数,实现了在同一个网络中对目标边界特征提取分支和实例分割分支的同步训练,从而能够更好地学习边界特征信息,有效提升显著实例的分割效果。2.提出了一种融合特征增强和注意力机制的显著实例分割模型。当显著实例之间存在遮挡和拥挤情况时,定位任务可能会存在漏检和误检的情况,使得分割效果的好坏受到实例定位精度的直接影响。因此,本文在MBCNet的基础上提出了一种融合特征增强和注意力机制的显著实例分割方法。该方法借鉴注意力机制的思想,通过设计一个融合特征增强和注意力机制的显著实例定位分支,利用特征增强模块来加强对显著实例位置信息的提取。同时,在显著实例分割分支中提出了多尺度Ro IAlign层,通过对多个不同尺度的特征图进行特征信息的提取与融合,进一步提升显著实例的分割效果。