融合交叉注意力机制的街景实时语义分割
作者机构:重庆师范大学计算机与信息科学学院 重庆市数字农业服务工程技术研究中心
出 版 物:《计算机应用与软件》 (Computer Applications and Software)
年 卷 期:2024年
学科分类:08[工学] 081303[工学-城市规划与设计(含:风景园林规划与设计)] 080203[工学-机械设计及理论] 0813[工学-建筑学] 0802[工学-机械工程]
基 金:重庆市教育委员会科学技术研究项目(KJQN201800536) 重庆市高校创新研究群体项目智慧农业的机器视觉感知与智能算法研究(CXQT20015)
摘 要:为了提高街景语义分割的边缘清晰度和小目标识别率,提出一种街景实时语义分割网络(CitySeNet)。该网络基于BiseNet V2,用交叉卷积块增强细节分支,用十字交叉注意力机制优化语义分支,并将两个分支的特征有效融合。在Cityscapes数据集上的实验结果显示,CitySeNet网络的平均交并比(mIoU)为77%,其中行人和自行车这两类小目标的交并比分别为82%和77%。语义分割的可视化结果表明,该网络能够更清晰地分割出目标边缘,有效地解决了边缘模糊和小目标识别不准确的问题,满足实时分割的需求。