咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于深度学习的人体姿态估计研究 收藏
基于深度学习的人体姿态估计研究

基于深度学习的人体姿态估计研究

作     者:李馨宇 

作者单位:电子科技大学 

学位级别:硕士

导师姓名:殷光强

授予年度:2021年

学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 08[工学] 081104[工学-模式识别与智能系统] 080203[工学-机械设计及理论] 0802[工学-机械工程] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

主      题:关键点定位 注意力机制 尺度自适应 热力图回归 人体姿态估计 

摘      要:在计算机视觉研究领域,人体姿态估计技术是动作分析、人机交互、智能监控、医疗辅助分析、工业测量和电影特效制作等诸多应用的关键技术。随着深度学习以及卷积神经网络被应用于各种领域,该技术得到长足的发展,使用卷积神经网络模型来进行人体姿态估计的研究越发流行。本文基于人体姿态估计最新的网络模型,改进关键点定位算法,从两个方向出发研究人体姿态估计的问题。第一个方向针对于现在卷积神经网络越发复杂,为了能够获取更有用的信息,通过注意力机制的思想改进高分辨率网络模型,深入研究人体姿态估计问题;第二个方向,针对于对于不同尺度关键点定位精度低问题中,根据语义分割领域的尺度自适应思想,提出了针对于不同尺度关键点的尺度自适应热力图回归的方法,来进一步改进已有的高分辨率网络模型。并探讨了注意力机制和尺度自适应热力图回归两种机制结合的可能性。(1)在基于注意力机制研究人体姿态估计问题时,本文章是基于高分辨率网络基础上进行改进。高分辨网络模型的网络中有非常多的通道数不同的分支网络,结合归一化方法和注意力机制的通道域注意力思想,通过将高分辨率网络中的残差模块进行修改,使得模型能够关注通道中的上下文信息,学习基于不同通道权重的信息,提高了人体姿态估计的预测准确率。本文提出的基于通道域注意力机制的高分辨率模型在公开的MSCOCO数据集上进行了测试,准确率增长了1.5%。(2)在基于关键点定位精度问题中,本论文提出一种应用于语义分割研究领域的思想:尺度自适应热力图回归。该思想可以通过对不同关键点对应进行不同尺度的热力图回归,进一步提升人体姿态估计网络模型的平均正确率。本文章提出的基于尺度自适应热力图回归的网络模型在公开的MPII、MSCOCO数据集上进行了测试,可以在HRNet和Higher HRNet模型上增长0.7%准确率。并探讨和验证了注意力机制与尺度自适应回归结合的可能性,两者结合之后,对高分辨率网络的准确率提升了大约2.0%。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分