基于卷积神经网络的人脸属性识别研究
作者单位:天津理工大学
学位级别:硕士
导师姓名:周冕
授予年度:2018年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 080203[工学-机械设计及理论] 0835[工学-软件工程] 0802[工学-机械工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:人脸属性识别,是利用计算机对人脸的面部特征信息,如性别、年龄、种族等一般生物信息进行分析辨别,同时还可对发色、脸型等特定类别进行区分,也可有效检验出待识别对象是否戴有帽子、眼镜、耳环等饰品,以及面部是否有妆容、表情等情况。另外,人脸属性识别在人机交互、人脸检索和安防系统等领域中有广泛的应用前景。因为人脸图像经常受到人脸姿势和光照等不可控制因素的影响,所以人脸属性识别还面临着诸多挑战。另一方面,深度学习是近年来非常热门的研究课题,其中,卷积神经网络已在多个领域中有着广泛的应用并取得较好的性能。因此,本文利用卷积神经网络技术对人脸属性识别的研究是一项既有研究意义且又富有挑战的工作。本文的具体工作如下:首先,本文分别从传统的学习方法和深度学习方法两个不同方面对人脸属性识别的研究现状进行分析,然后又根据属性识别分类任务的不同,来分析单任务和多任务的人脸属性识别算法。最后着重介绍了在传统的人脸属性识别方法和基于深度学习的人脸属性识别方法中,特征提取的过程和属性分类的过程。其次,传统的人脸属性识别算法只能通过手工方式提取低层次的人脸特征,无法应对由姿态、光照等条件引起的复杂面部变化给人脸属性识别所带来的挑战。针对此问题,本文引入多级子网络,提出基于多级子网络的单任务人脸属性识别算法。该方法在设计网络结构时采用“Network in Network的概念,在每个子网络中,均有三个卷积层构成,经过多次卷积,子网络中的特征映射图尺寸保持不变。同时为了减少加载模型的时间,引入Slice层和Eltwise层,使得网络模型体积大大减小。本算法采用端到端的网络结构,进一步提高了网络的训练能力。该算法较目前最先进的算法在CelebA和LFWA数据集上准确率分别提高了3.1%和4.3%。从现有的研究成果发现,部分属性识别准确率较低。针对此问题,本文提出将人脸部件和多标签网络相结合的算法。首先将人脸根据68个标记点信息划分为眼睛、鼻子、嘴巴、下巴、脸部和全图六个部分,并将四十个属性和其对应的部件相结合。其次,充分挖掘脸部的局部特征、全局特征和属性之间的关系,并将属性所属区域和其对应部件相契合。然后,根据六个人脸部件设计多标签网络,预测出人脸每个属性的准确率。最后该算法在CelebA、LFWA数据集上进行验证,识别准确率较低的情况得到明显改善。