深度图像下基于特征学习的人体检测方法研究
作者单位:厦门大学
学位级别:硕士
导师姓名:苏松志
授予年度:2014年
学科分类:08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程]
摘 要:人体检测是计算机视觉领域的研究热点与难点,在智能监控、智能家居服务型机器人、汽车的安全驾驶、机器人视觉导航、智能交通、游戏娱乐等方面都有广泛的应用。人体检测不仅有直接的应用价值,同时也是计算机实现人体动作行为识别和跟踪等视觉技术的基础,具有很好的理论研究价值。 根据图像数据类型的不同,人体检测的研究大体分为基于RGB图像的检测与基于深度图像的检测。目前,基于RGB图像上的人体检测已经取得一定的进展,但RGB图像的人体检测,常常因为受光照变化、阴影、物体遮挡及复杂背景等因素的干扰,检测性能大受影响。深度图像作为一种新型的数据描述方式,不仅可以保存物体的空间位置信息,而且具有保护隐私、不受光照变化影响以及维度小的优点。随着Kinect传感器的出现,基于深度图像的人体检测逐渐成为新潮。本文围绕深度图像的人体检测,首先概述了基于RGB图像的人体检测与基于深度图像的人体检测的研究现状,并对人体检测里一些常用特征提取方法的基本思想与原理做简要介绍。在对国内外计算机视觉领域的人体检测研究方法做归纳与总结的基础上,重点进行了如下两个方面的工作: 1.在检测速度方面,针对滑动窗口法在人体检测方面存在搜索空间大的问题,提出了检测前聚类的概念,将其加入人体检测框架。为加速特征提取过程,在人体检测前预先对人体的可能位置进行定位,并裁剪出待检测图像集。 2.在深度图像的人体描述子方面,将深度学习方法引入深度图像的人体检测中,通过稀疏自编码(SAE)来学习人体的深度特征,并对图像的深度信息进行重新编码,从而实现图像的特征提取。 最后,在SZU Kinect人体检测数据集上,我们将本文所用的深度学习方法SAE提取的人体特征与深度图像人体检测里的一些典型的特征提取方法,如HOD, HDD, SLTP, RDSF,以及我们改进的SLTP算法进行实验对比。在分类器的选择上,比较了SVM与Softmax两种分类器的检测性能。 实验结果表明本文对基于深度图像的人体检测框架的改进很大程度上提高了人体检测的速度。深度学习算法在深度图上的人体检测是有效的。