咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于特征融合和自适应锚框的目标检测算法研究 收藏
基于特征融合和自适应锚框的目标检测算法研究

基于特征融合和自适应锚框的目标检测算法研究

作     者:陈运忠 

作者单位:河南大学 

学位级别:硕士

导师姓名:刘先省;张苗辉

授予年度:2020年

学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 08[工学] 081104[工学-模式识别与智能系统] 080203[工学-机械设计及理论] 0802[工学-机械工程] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

主      题:目标检测 卷积神经网络 特征提取 特征融合 自适应锚框 

摘      要:近年来,目标检测在智慧城市、无人驾驶、视频信息检索等诸多领域都得到了广泛应用,是计算机视觉、人工智能等领域的重要研究方向之一。本文首先介绍了基于深度学习的目标检测算法的基本理论,然后围绕双阶段目标检测算法进行分析,在目标检测的特征提取、候选区域建议和分类回归阶段分别提出改进措施,提升算法对尺度变化较大、长宽比例悬殊和遮挡目标的检测精度。本文主要工作如下:(1)针对已有的特征提取网络在特征提取过程中连续下采样造成特征图分辨率过低,导致算法对于小目标检测精度低、漏检等问题,实现了一种名为检测网络-特征金字塔网络 DetNet-FPN(Detection Network-Feature Pyramid Network)的多尺度特征融合网络。该网络在特征图提取网络的前四个阶段和ResNet-50保持一致,即每经过一个阶段特征图进行2倍的下采样,在第五、六阶段,取消特征图的下采样,保持特征图为16倍的下采样不变,以此保证特征图具有较高的分辨率,同时在第五、六阶段,设计了两种瓶颈结构(BottleNeck),在这两个结构中引入空洞卷积替换传统卷积来扩大感受野,使得算法能够保证在特征图拥有较大分辨率的同时获得较大的感受野,从而对尺度较大和较小的目标都能获得较高的召回率。(2)设计了一种基于自适应锚框的区域建议网络SA-RPN(Self-adaptation Anchor Region Proposal Network)。基于区域建议的目标检测算法在获取候选区域时,往往根据数据集中大量目标的尺寸聚类结果,预先设定锚框的尺寸和长宽比例,这样获得的候选区域对于极端大小和长宽比例悬殊的目标很容易导致漏检和定位不准确等问题。本文使用的自适应的锚框生成网络SA-RPN把锚框的产生过程分为两个不同的分支:锚框位置预测和形状预测分支。网络首先根据特征图预测锚框的位置,然后结合锚框的位置信息预测其形状信息,把位置和形状预测分支的结果结合起来就得到最终的候选区域。最后为了匹配产生的锚框和对应的特征图比例,设计了一种基于锚框尺寸的特征自适应模块FAM(Feature Adaptive Module),在该模块中使用可变形卷积代替传统卷积,能够根据产生的锚框形状调整对应的特征图大小,从而使得特征图和锚框信息匹配。实验结果表明,该网络能够根据目标的大小和长宽比例产生自适应大小的锚框,使得算法对于各种尺度的目标都能精确回归。(3)在网络的训练过程中,结合本文算法实际设计了一个多任务损失函数,该损失函数除了包含常见的分类和回归损失函数之外,还包含位置和形状损失函数,它们被统一到一个多任务损失函数之中联合优化,实现了端到端的目标检测。另外,针对非极大值抑制算法对于密集和重叠目标容易造成漏检的问题,本文引入了一种改进的非极大值抑制算法Soft-NMS(Non Maximum Suppression),该算法对于同一个目标上的重叠建议框不是直接抑制掉,而是通过降低重叠候选框的置信度,减少重叠目标的漏检问题。本文首先在通用目标检测数据集PASCAL VOC上进行消融实验,验证本文框架中每部分算法的有效性,然后将主流目标检测算法与本文算法的检测精度进行比较,实验表明本文算法相较于目前主流的目标检测算法Cascade R-CNN(以ResNet-50为特征提取网络)获得了 3.41%的精度提升。为了进一步验证算法的泛化性能,有针对性地选择了遥感数据集NWPU VHR-10,本文算法在该数据集上相较于目前主流的检测框架Faster R-CNN(以ResNet-50为特征提取网络)取得了 3.59%的精度提升。总体来说,本文框架是一个实用性强、检测精度高、泛化能力强的通用目标检测解决方案。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分