基于网络结构搜索的人体姿态估计算法研究
作者单位:南京大学
学位级别:硕士
导师姓名:陈春林
授予年度:2020年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 080203[工学-机械设计及理论] 0835[工学-软件工程] 0802[工学-机械工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:人体姿态估计 网络结构搜索 注意力机制 多尺度特征融合
摘 要:人体姿态估计是计算机视觉领域中最重要的研究任务之一,其目的是使计算机准确地识别出人体骨骼关键点的坐标位置。目前主流的人体姿态估计网络都是基于人工进行设计的,存在偶然性和实验重复性等缺点,因此,将网络结构搜索技术应用到人体姿态估计领域十分必要。本研究基于现有优秀的人体姿态估计网络结构模型,通过网络结构搜索技术实现自动的人体姿态估计网络结构设计,提出了一种优异的人体姿态估计网络结构模型。首先在高分辨率语义表达网络的基础上,设计了一种可搜索的模型;接着,针对人体姿态估计任务的特点,重新设计了搜索空间;然后,为了解决网络结构搜索过程中计算量大、显存占用多的问题,提出了一种基于注意力机制的优化方法;最后,为了充分实现网络特征的表达能力,本文提出了一个多尺度特征融合模块,对不同分辨率的特征进行特征融合,更好地提升了特征的语义表达能力。通过将网络结构搜索技术与人体姿态估计任务相结合,解决了人体姿态估计任务中网络结构设计复杂,耗时长,偶然性大等缺点,使得网络结构的设计更加简单高效,具有较大的研究意义和广泛的应用前景。