高精度实时语义分割算法框架:多通道深度加权聚合网络
High precision real-time semantic segmentation algorithm:Multi-channel deep weighted aggregation network作者机构:内蒙古工业大学电力学院呼和浩特010080 大规模储能技术教育部工程研究中心呼和浩特010080 内蒙古自治区高等学校智慧能源技术与装备工程研究中心呼和浩特010080 北京工业大学信息学部北京100080
出 版 物:《控制与决策》 (Control and Decision)
年 卷 期:2024年第39卷第5期
页 面:1450-1460页
核心收录:
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金项目(62241309) 内蒙古科技计划项目(2020GG028,2021GG164) 内蒙古自然科学基金项目(2020MS05029,2021MS06018)
摘 要:近年来随着深度学习技术的不断发展,涌现出各种基于深度学习的语义分割算法,然而绝大部分分割算法都无法实现推理速度和语义分割精度的兼得.针对此问题,提出一种多通道深度加权聚合网络(MCDWA_Net)的实时语义分割框架.该方法首先引入多通道思想,构建一种3通道语义表征模型, 3通道结构分别用于提取图像的3类互补语义信息:低级语义通道输出图像中物体的边缘、颜色、结构等局部特征;辅助语义通道提取介于低级语义和高级语义的过渡信息,并实现对高级语义通道的多层反馈;高级语义通道获取图像中上下文逻辑关系及类别语义信息.之后,设计一种3类语义特征加权聚合模块,用于输出更完整的全局语义描述.最后,引入一种增强训练机制,实现训练阶段的特征增强,进而改善训练速度.实验结果表明,所提出方法在复杂场景中进行语义分割不仅有较快的推理速度,且有很高的分割精度,能够实现语义分割速度与精度的均衡.