基于历史信息及改进SimSiam的道路目标检测
Road Object Detection Based on Historical Information and Improved SimSiam作者机构:中国科学技术大学信息科学技术学院合肥230026
出 版 物:《计算机系统应用》 (Computer Systems & Applications)
年 卷 期:2024年第33卷第6期
页 面:192-200页
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 08[工学] 081104[工学-模式识别与智能系统] 080203[工学-机械设计及理论] 0802[工学-机械工程] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:科技创新特区计划(20-163-14-LZ-001-004-01)
摘 要:视觉导航旨在通过环境中的视觉信息提供导航依据,其中关键任务之一就是目标检测.传统的目标检测方法需要大量的标注,且只关注图像本身,并未充分利用视觉导航任务中的数据相似性.针对以上问题,本文提出一种基于历史图像信息的自监督训练任务.该方法聚合同一位置的多时刻图像,通过信息熵区分前景与背景,将图像增强后传入SimSiam自监督范式进行训练.并改进SimSiam投影层和预测层中的MLP为卷积注意力模块和卷积模块,改进损失函数为多维向量间损失,以提取图像中的多维特征.最后,将自监督预训练所得模型用于下游任务的训练.实验表明,在处理后的nuScenes数据集上,本文提出的方法有效提高了下游分类及检测任务的精度,在下游分类任务上Top5准确率达到66.95%,检测任务上mAP达到40.02%.