咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于Transformer双线性网络的细粒度图像分类方法 收藏

基于Transformer双线性网络的细粒度图像分类方法

Fine grained image classification network based on transformer bilinear network

作     者:向旭宇 刘亚捷 曾彬 谭云 XIANG Xuyu;LIU Yajie;ZHENG Bin;TAN Yun

作者机构:中南林业科技大学计算机与信息工程学院湖南长沙410000 长沙学院计算机科学与工程学院湖南长沙410000 

出 版 物:《华中科技大学学报(自然科学版)》 (Journal of Huazhong University of Science and Technology(Natural Science Edition))

年 卷 期:2024年第52卷第2期

页      面:84-89页

核心收录:

学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家自然科学基金青年项目(62002392) 湖南省自然科学基金资助项目(2022JJ31019,2020JJ4141) 长沙市物联网安全态势感知与风险评估技术研发创新平台建设项目 

主  题:细粒度 特征融合 图像分类 双线性 Transformer 

摘      要:为了改进在细粒度图像分类过程中类别差异难以提取的问题,提出了一种基于Transformer双线性网络的细粒度网络分类优化方法(BT-Net).首先,将输入图像通过不同卷积处理成不同长度的二维向量;然后,构建重复次数不同的编码器;最后,双网络分支将图像表示为来自两个Transformer的特征集合,得到更加丰富的互补特征信息,从而提高细粒度分类的精度.实验结果表明:在CUB-200-2011,Cars196和Stanford Dogs数据集中,BT-Net分类准确率分别为89.4%,92.5%,94.8%,优于已有的双线性卷积神经网络.

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分