基于改进的Faster R-CNN图像人物检测研究
作者单位:安徽理工大学
学位级别:硕士
导师姓名:周华平
授予年度:2020年
学科分类:08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程]
主 题:人物检测 卷积神经网络 Faster R-CNN 特征提取
摘 要:人物检测是目标检测的一个重要研究内容,包含人物识别和人物定位,是指在图像中定位人物并找到人物的位置和范围,并用合适的框把人物标记出来。在当前各行各业智能化发展的今天,作为必要的前置处理,人物检测在智能交通,视频监控,目标跟踪等领域都有着广泛的研究和应用,其中人物检测算法在推进智能化建设的今天就显得至关重要。本文首先对目标检测和人物检测的研究意义和国内外研究进展进行了分析、归纳总结,然后重点研究了深度学习领域的重要检测算法,比如R-CNN系列算法。在这些基础之上,我们做的主要工作如下:(1)通过对图像中人物检测的难点进行详细分析,选择Faster R-CNN作为本文的研究算法。并通过对比分析VGG与ResNet两种基础网络,最终选取性价比最高的ResNet101作为本文网络模型的基础网络,在此基础上,重点研究了基于Faster R-CNN目标检测算法的理论基础和实现原理。(2)针对Faster R-CNN在目标检测上的主要缺陷,对基于Faster R-CNN的目标检测算法进行了三方面的改进:一是将原算法中的基础网络替换为BT-ResNet101网络,依据Inception网络思想,通过增加网络的宽度来提升网络的性能,并用于提取丰富的特征信息;二是ZT-RPN在网络中加入了两种滑动窗口,三种不同大小的滑动窗口进行卷积之后再进行特征融合,通过提高网络的感受野,使新生成的特征框图更加准确;三是使用ROI Align替代原始的ROI Pooling,减少整数量化带来的误差,解决区域不匹配的问题。(3)分别在本文收集的图像人物测试集和VOC07测试集上验证了本文改进算法的合理性和有效性。实验结果表明,使用本文方法对图像人物的检测能达到81.1%的平均检测精度,对目标人物的预测也较为精准。通过与其他模型比较分析,本文模型不仅对人物图像具有较好的检测效果,而且对复杂环境下拍摄的其他图像的检测也有优秀的表现。图[28]表[10]参数[64]