咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >结合Segformer与增强特征金字塔的文本检测方法 收藏

结合Segformer与增强特征金字塔的文本检测方法

作     者:张铭泉 张泽恩 曹锦纲 邵绪强 

作者机构:华北电力大学控制与计算机工程学院 华北电力大学复杂能源系统智能计算教育部工程研究中心 

出 版 物:《智能系统学报》 (CAAI Transactions on Intelligent Systems)

年 卷 期:2024年

核心收录:

学科分类:08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程] 

基  金:中央高校基本科研业务费专项资金(2021MS092) 河北省省级科技计划资助项目(22310302D) 

主  题:文本检测 特征金字塔 注意力机制 Segformer Ghost模块 多尺度特征融合 平均池化 最大池化 

摘      要:针对自然场景文本检测算法中的小尺度文本漏检、类文本像素误检以及边缘定位不准确的问题,提出一种基于Segformer和增强特征金字塔的文本检测模型。该模型首先采用基于混合Transformer(mix Transformer, MiT)的编码器生成多尺度特征图;然后,在具有特征金字塔结构解码器的上采样部分,提出级联融合注意力模块,通过全局平均池化、全局最大池化和Ghost模块获取全局通道信息并保留文本特征;接着,在解码器的特征融合部分提出两级正交融合注意力模块,利用非对称卷积分别从水平和垂直方向进行信息增强;最后,利用可微分二值化对结果进行后处理。将本文方法在ICDAR2015、ShopSign1265和MTWI 3个数据集上进行实验,相比于其他8种方法,本文方法的F值均为最优,分别达到了87.8%、59.1%和74.8%。结果表明,本文方法有效提高了文本检测的准确率。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分