基于全局滤波池化多关系Transformer网络的行人重识别
Person Re-identification Based on Global Filter Pooling Multi Relation Transformer Network作者机构:上海理工大学光电信息与计算机工程学院上海200093
出 版 物:《控制工程》 (Control Engineering of China)
年 卷 期:2024年第31卷第5期
页 面:912-919页
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:行人重识别 Transformer 全局滤波池化 多关系网络
摘 要:行人重识别(Re-identification,ReID)的关键挑战之一是提取关键且鲁棒的特征,近年来,Transformer网络不断展现其在该问题上具有强大的特征提取和表达能力。针对传统Transformer网络局部信息获取不如卷积神经网络的问题,提出一个基于ReID的全局滤波池化多关系Transformer(Trans-global filter pooling multi relationship-ReID,TFMR)网络新型框架,解决了Transformer网络局部关系建模不够丰富的问题。多关系(multi relation,MR)网络考虑身体多个部位间的关系,使特征包含局部信息之间的联系,增强特征中行人生理结构的关联。同时设计了全局滤波池化(global filter pooling,GFP)模块,将其嵌入到Transformer网络中,降低图片中噪点的干扰并减少视图变化造成的特征偏差,从而获取人物图像中更清晰的全局特征,提升识别准确率。实验表明,模型在区分行人信息问题上具有高效性,在Market-1501、DukeMTMC-ReID和MSMT17数据集中优于其他模型。