咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于空洞卷积融合Transformer的无人机图像小目标检测... 收藏

基于空洞卷积融合Transformer的无人机图像小目标检测方法

作     者:王林 刘景亮 王无为 

作者机构:西安邮电大学自动化学院 西安理工大学自动化与信息工程学院 厦门工学院数据科学与计算机学院 

出 版 物:《计算机应用》 (Journal of Computer Applications)

年 卷 期:2024年

学科分类:08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程] 

基  金:国家自然科学基金资助项目(62202376) 陕西省科协青年人才托举计划(20220129) 陕西省教育厅专项科研计划(22JK0565) 厦门工学院科学与技术研究院启动项目(KYYKT202301) 

主  题:小目标检测 特征融合 空洞卷积 无人机图像 Swin Transformer 

摘      要:针对无人机航拍图像中目标场景复杂、尺度多样、小目标密集和遮挡严重的问题,提出一种多尺度空洞卷积的Swin-Det无人机图像目标检测算法。首先,采用Swin Transformer作为主干特征提取网络,并在主干网络中引入空间信息交融模块,解决因物体间的遮挡而导致目标信息模糊的问题;其次,提出一种融合空洞特征金字塔网络,通过多分支的空洞卷积将特征信息进行融合,有效提高网络的感受野和特征信息的复用,使模型可以学习到不同维度的细节特征;最后,采用线性插值法和多任务损失函数,解决预测区域不匹配和样本不平衡的问题,提升模型的检测精度。在VisDrone数据集上的实验结果表明,所提算法的平均精度均值达到了27.2%,与原始Swin Transformer相比,平均精度均值提高了4.1个百分点,且在同一训练批次下收敛更快。所提算法在复杂场景下能对无人机图像目标实现高精度检测。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分