咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >融合注意力与残差连接的视觉Transformer跟踪算法 收藏

融合注意力与残差连接的视觉Transformer跟踪算法

作     者:田攀帅 葛海波 安玉 薛紫涵 

作者机构:西安邮电大学电子工程学院 

出 版 物:《计算机工程与应用》 (Computer Engineering and Applications)

年 卷 期:2024年

学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 080203[工学-机械设计及理论] 0835[工学-软件工程] 0802[工学-机械工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:陕西省自然科学基金(2011JM8038) 陕西省重点产业创新链(群)项目(S2019-YF-ZDCXL-0098) 

主  题:目标跟踪 特征丢失 孪生网络 残差注意力 像素互相关 

摘      要:针对目标跟踪中网络模型加深导致低级特征丢失和速度与精度不平衡的问题,提出了一种融合注意力与残差连接的VIT跟踪算法MRATrans(Multi-head Residual Attention Transformer)。使用MobileViT作为主干网络,在保持较低模型复杂度的同时实现了丰富的特征表示。首先,提出残差注意力模块(Residual attention module,RAM),有效防止低级特征丢失问题,并设计了多头残差注意力(Multi-head residual attention,MHRA)模块,同时关注不同子空间表示的信息,进一步提高了模型的表达能力;此外,构建密集像素相关(Dense pixel correlation,DPC)模块计算模板和搜索区域的相似性,避免空间失真,获得具有更丰富语义信息的响应图;最后通过分类回归网络实现准确的跟踪。通过OTB100、VOT2018和GOT-10K数据集上的大量实验,证明了MRATrans与主流算法相比拥有更优的性能,并达到87帧/s的速度,在保持高效性的同时实现了准确的跟踪。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分