快速超轻量城市交通场景语义分割
Rapid and Ultra-lightweight Semantic Segmentation in Urban Traffic Scene作者机构:暨南大学信息科学技术学院广州510632
出 版 物:《计算机科学与探索》 (Journal of Frontiers of Computer Science and Technology)
年 卷 期:2022年第16卷第10期
页 面:2377-2386页
核心收录:
学科分类:1305[艺术学-设计学(可授艺术学、工学学位)] 13[艺术学] 08[工学] 081104[工学-模式识别与智能系统] 0804[工学-仪器科学与技术] 081101[工学-控制理论与控制工程] 0811[工学-控制科学与工程]
基 金:国家自然科学基金(62002134) 广东省基础与应用基础研究基金(2020A1515110645) 广东省重点实验室项目(2021KSY001) 广州市创新领军人才项目(2019019) 暨南大学中央高校基本科研业务费项目(21620353) 暨大-泰斗联合培养研究生基地项目(82621176)
主 题:快速语义分割 轻量化网络 通道注意力 空间注意力 城市交通
摘 要:近年来,随着自动驾驶的火热发展,越来越多研究者开始探索图像语义分割网络的轻量化并将其应用于道路交通场景。而目前现存的语义分割网络通常由于参数量庞大难以部署在硬件资源有限的边缘设备,针对这一问题,设计了一个由通道注意力骨干网络(CABb)和空间注意力解码器(SAD)模块构成的双注意力轻量化网络(DALNet),结合“通道-空间双注意力机制的DALNet在图像上下文语义信息的提取和图像空间信息的恢复上都具有突出的表现。CABb主要由通道注意力瓶颈(CABt)模块组成,CABt模块采用Split策略分离特征通道并行处理多尺度的特征图,引入通道注意力机制进行通道融合,提取多尺度语义信息。SAD模块利用空间注意力机制指导解码器进行双线性插值上采样,恢复分割目标边沿以及细节信息。实验结果表明,DALNet仅凭48万的参数量在城市交通数据集Cityscapes和CamVid最高分别可达到74.1%和70.1%的交并比(mIoU)。DALNet在输入图像分辨率为512×1024的情况下,基于GTX 1080TiGPU可以获得74 frame/s的前向推理速度,远超实时语义分割所需的速度要求。