基于G-UNet的多场景行人精确分割与检测
Pedestrian segmentation and detection in multi-scene based on G-UNet作者机构:广西大学电气工程学院南宁530004
出 版 物:《吉林大学学报(工学版)》 (Journal of Jilin University:Engineering and Technology Edition)
年 卷 期:2022年第52卷第4期
页 面:925-933页
核心收录:
学科分类:08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:计算机应用 行人语义分割 高斯核 柔性连接 目标增强损失
摘 要:目前的语义分割方法可以得到行人的轮廓,但在行人相互遮挡时,无法直接得到图中行人的数量、身高和中心位置等信息。针对这一缺陷,提出了G-UNet模型算法:在语义分割主干之外,增加一个行人区域的高斯椭圆密度核检测分支,通过核的极大值点、垂直和水平轴尺度,分别检测行人的中心位置、高度和宽度,并由密度核极大值点的唯一性,解决了行人遮挡的检测难题。另外,UNet以空间对称的方式将底层和高层特征进行硬性的拼接,使得50%的固定误差直接传播到底层。本文提出可训练的柔性系数拼接方式,可以得到最优的误差分配传播方式。最后,传统的损失函数的误差值与行人标定面积成正比,导致小尺度行人容易漏检,本文提出目标增强损失函数提高网络检测小尺度行人的能力。在自建行人分割数据库中,实验结果证明了本文方法的有效性且优于其他方法。