基于Transformer双线性网络的细粒度图像分类方法
Fine grained image classification network based on transformer bilinear network作者机构:中南林业科技大学计算机与信息工程学院湖南长沙410000 长沙学院计算机科学与工程学院湖南长沙410000
出 版 物:《华中科技大学学报(自然科学版)》 (Journal of Huazhong University of Science and Technology(Natural Science Edition))
年 卷 期:2024年第52卷第2期
页 面:84-89页
核心收录:
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金青年项目(62002392) 湖南省自然科学基金资助项目(2022JJ31019,2020JJ4141) 长沙市物联网安全态势感知与风险评估技术研发创新平台建设项目
主 题:细粒度 特征融合 图像分类 双线性 Transformer
摘 要:为了改进在细粒度图像分类过程中类别差异难以提取的问题,提出了一种基于Transformer双线性网络的细粒度网络分类优化方法(BT-Net).首先,将输入图像通过不同卷积处理成不同长度的二维向量;然后,构建重复次数不同的编码器;最后,双网络分支将图像表示为来自两个Transformer的特征集合,得到更加丰富的互补特征信息,从而提高细粒度分类的精度.实验结果表明:在CUB-200-2011,Cars196和Stanford Dogs数据集中,BT-Net分类准确率分别为89.4%,92.5%,94.8%,优于已有的双线性卷积神经网络.