咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于点监督的人群密度估计 收藏
基于点监督的人群密度估计

基于点监督的人群密度估计

作     者:张家兴 

作者单位:天津理工大学 

学位级别:硕士

导师姓名:李菁

授予年度:2023年

学科分类:08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程] 

主      题:人群计数 点监督 注意力机制 多尺度融合 透视信息 

摘      要:估计图像中物体的数量是一项具有挑战性但又有意义的任务,并已被应用于城市规划和公共安全等许多应用中。在各种对象计数任务中,人群计数因其具有促进社会安全和发展等特殊的意义而尤为突出。例如,近几年,新冠肺炎肆虐全球、踩踏事故时有发生,人群计数此项技术的应用能够有效地防止此类事故。但现实情况复杂多样,如背景杂乱和尺度变化等问题影响着人群计数算法的准确性。为了应对这些挑战,本文提出以下两种不同的人群计数算法。(1)由于透视失真,人头的尺度会因位置的差异发生变化,近处人头较大而远处较小。透视信息编码了摄像机与场景之间的距离,将其加入到网络模型中可以更有效地处理尺度变化。本文提出了透视引导网络,将透视信息嵌入到点监督网络中。首先,本文构建了一种含有透视信息的透视注意力方法,在空间和通道两个维度都能实现关注关键特征,忽视不重要的特征。其次,本文提出了透视引导融合模块将多尺度特征与透视注意力结合,以解决尺度变化和背景杂乱。(2)近年来,基于密度图的方法因其效果显著被普遍采用。但因为遮挡、尺度变化等原因,这些方法并不总是能生成准确的高质量的人群密度图。因此,本文提出了一种点监督的尺度自适应人群密度估计算法(Point-supervised Scale Adaptive Network,PSANet),它直接将注释点作为训练目标,避免了生成不准确的人群密度图。但PSANet的输出值是连续的,而注释点是离散的,因此本文提出了一种最优匹配损失,它在输出值和注释点之间建立匹配传输矩阵,以确保每个注释点与输出特征图中的特定的像素相匹配。为了进一步解决尺度问题,本文提出了尺度自适应卷积,它利用不同的空洞卷积来提取多尺度特征,然后利用注意力机制进行融合。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分