目标检测与属性分析联合网络模型的研究与应用
作者单位:电子科技大学
学位级别:硕士
导师姓名:李文生;陈爱国
授予年度:2020年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 080203[工学-机械设计及理论] 0835[工学-软件工程] 0802[工学-机械工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:人体属性分析在计算机视觉中是一个重要的研究课题,在人脸验证以及行人检索方面都有很多重要的应用,提高属性的识别率,对提升基于属性特征应用的效果有很大帮助。人体属性分析过程中,都需要先识别和检测出人体,然后再针对检测到的每一个人体对象进行属性分析。现有人体属性分析方法存在模型运行效率低、经验知识未被有效利用等问题,为此,本论文开展了三个方面的研究:(1)提出了一个端到端的目标检测与多属性分析联合学习网络框架——细粒度多属性联合网络模型(Fine Grained Multi-Attribute R-CNN,FGMA R-CNN)。现有人体属性分析方法将目标检测和属性分析作为两个独立任务,分别搭建深度卷积神经网络进行学习,该方式往往忽略了来自其他任务的经验信息,训练过程冗余重复,导致学习资源的浪费,也限制了其性能的提升。本文FGMA R-CNN方法通过共享主干网络的权重和特征,实现单个模型同时完成人体检测及其属性分析任务,该模型具有速度快和特征学习能力强的优点。(2)提出了基于属性相关性约束的学习方法。针对人体多个属性之间存在的关联关系,例如,穿裙子的一般是女性,上身穿着正装的人不太可能穿着短裤,类似的先验知识在现有分析模型中没有得到有效利用。为此,通过计算属性之间的置信度和提升度来分析人体属性之间的相关性,将这种属性相关性作为先验知识来改进损失函数,指导网络对人体属性相关性的学习,从而避免网络产生有违先验条件的结果并进一步提高人体属性识别的准确率。(3)设计了一种基于多梯度下降的多目标优化算法。目前针对大多数处理多任务学习优化问题的方法,是直接对多个目标损失进行非负加权求和,进而将其转化为一个单目标优化问题,而这种直接加权求和的方法无法解决多任务之间的竞争冲突。本文提出的算法适用于目标检测与属性分析的两层级联合网络。通过寻找网络优化的帕累托最优解,将网络训练过程中的优化问题转化为一个多目标优化问题,该方法可以有效避免任务之间的冲突,从而进一步提升网络的泛化性能。最后,展开联合网络模型在智能视觉识别系统中的应用研究,验证其在工程上的可行性。基于FGMA R-CNN框架,开发适用于智能广告推送的视觉识别系统。针对网络规模、计算效率、精确度和硬件需求等技术指标,研究其在特殊应用场景中的适应性。