显著性增强和全局感知的RGB-T显著性目标检测
作者机构:云南大学信息学院
出 版 物:《计算机辅助设计与图形学学报》 (Journal of Computer-Aided Design & Computer Graphics)
年 卷 期:2024年
核心收录:
学科分类:08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程]
基 金:国家自然科学基金(62162065) 云南省科技厅基金(202105AF150011)
主 题:RGB-T显著性目标检测 细节轮廓 高级语义信息 多级特征
摘 要:有效捕捉和利用图像不同特征层之间的特性和互补潜力, 对于精确定位显著目标和保留其细节轮廓具有重要意义. 针对现有的大多数RGB-T显著性目标检测方法将提取到的图像特征直接输入到聚合模块中, 并利用简单的递归结构定位显著目标, 其所带来的低泛化能力问题, 提出了一种显著性增强和全局感知的RGB-T显著性目标检测方法. 首先利用预训练模型提取图像的原始特征; 其次提出降噪模块(NRM), 作为编码和跨模态解码之间的桥梁, 以纯化显著对象的特征表示; 再次提出高级语义指导模块(HSGB), 融合不同模态的高级语义信息, 以保留显著对象的位置信息; 最后设计跨模态交互模块(MMIB)在保留显著对象位置信息的同时, 并指导解码模块进行多级特征的聚合操作, 得到最终显著图. 在VT821、VT1000和VT5000数据集上的实验结果表明, 所提方法的MAE指标分别达到3.0%、1.8%和3.0%, 性能优于大多数主流方法.