融合Transformer和DeepLabv3+的电力线语义分割网络
Power line semantic segmentation network based on Transformer and DeepLabv3+作者机构:上海电力大学电子信息工程学院上海201306 北京交通大学电子信息工程学院北京100044
出 版 物:《现代电子技术》 (Modern Electronics Technique)
年 卷 期:2024年第47卷第17期
页 面:109-116页
学科分类:0711[理学-系统科学] 07[理学] 081203[工学-计算机应用技术] 08[工学] 080401[工学-精密仪器及机械] 0804[工学-仪器科学与技术] 080402[工学-测试计量技术及仪器] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:电力线分割 Transformer DeepLabv3+ 多尺度特征融合 编码器 解码器 坐标注意力机制
摘 要:为解决目前语义分割算法在电力线分割领域存在预测速度缓慢和分割精度不高的双重问题,提出一种电力线分割网络STDC-DeepLabv3+。首先,为提升网络预测速度,在编码器部分采用Swin Transformer V2设计轻量化的主干特征提取网络;其次,为提高分割精度,针对电力线的细长结构以及贯穿整幅图片的特点,提出动态蛇形空间金字塔池化(DSASPP)模块,同时,在解码器部分设计多尺度特征融合模块,使网络更好地利用不同层次的语义信息提取电力线特征,减少网络对电力线的漏分割现象;最后,引入坐标注意力(CA)机制减少背景干扰,进一步提升分割的准确率。实验结果表明,改进后的算法平均交并比(MIoU)和平均像素精度(MPA)分别达到了84.18%和92.85%,与现有分割算法相比,分割精度和预测速度均有所提升,预测速度与DeepLabv3+相比提升了93.92%。