基于多层次自注意力网络的人脸特征点检测
Facial Landmark Detection Based on Hierarchical Self-Attention Network作者机构:上海交通大学电子信息与电气工程学院上海200240
出 版 物:《计算机工程》 (Computer Engineering)
年 卷 期:2024年第50卷第2期
页 面:239-246页
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金面上项目(62171283) 上海市自然科学基金(20ZR1426300) 上海市市级科技重大专项(2021SHZDZX0102)
主 题:人脸特征点检测 卷积神经网络 自注意力机制 特征融合 多任务学习 深度学习
摘 要:人脸特征点检测是人脸图像处理的关键步骤之一,常用检测方法是基于深度神经网络的坐标回归方法,具有处理速度快的优点,但是用于回归的高层次网络特征丢失空间结构信息,且缺乏细粒度表征能力,导致检测精度降低。针对该问题,提出一种基于多层次自注意力网络的人脸关键点检测算法。为提取更具有细粒度表征能力的图像语义特征,构建基于自注意力机制的多层次特征融合模块,实现高层次高语义信息特征和低层次高空间信息特征的跨层次特征融合。在此基础上,设计一种多任务学习人脸特征点检测定位与人脸姿态角估计的训练方式,优化网络对人脸整体朝向姿态的估计,以提升特征点检测的准确性。在人脸特征点主流数据集300W和WFLW上的实验结果表明,与SAAT、AnchorFace等方法相比,该方法有效提升网络的检测精度,标准平均误差指标分别为3.23%和4.55%,相较于基线模型降低0.37和0.59个百分点,在WFLW数据集上错误率指标为3.56%,相较于基线模型降低了2.86个百分点,能够提取更具鲁棒性和细粒度的表达特征。