咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于双塔结构的场景文字检测模型 收藏

基于双塔结构的场景文字检测模型

Scene Text Detection Model Based on Double Tower Structure

作     者:施漪涵 仝明磊 张魁 姚宏扬 SHI Yihan;TONG Minglei;ZHANG Kui;YAO Hongyang

作者机构:上海电力大学电子与信息工程学院上海200090 

出 版 物:《计算机工程与应用》 (Computer Engineering and Applications)

年 卷 期:2022年第58卷第3期

页      面:242-248页

学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081203[工学-计算机应用技术] 08[工学] 081104[工学-模式识别与智能系统] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:上海市自然科学基金(16ZR1413300) 

主  题:卷积神经网络 特征融合 文字检测 图像分割 

摘      要:当图像中文字区域形状复杂多变时,传统锚点方法难以精确定位文字,针对这一问题,提出一种具有双塔结构的文字分割检测算法。在网络中增加自下而上的特征增强路径以充分提炼语义信息,与上一级自上而下的结构形成双金字塔模型;接着新增一条路径缩短较底层与最顶层特征之间的距离,同时使用膨胀卷积,增大卷积核的感受野;在损失函数的设计中引入γ参数,改变图像中正负样本的权重分配,使网络更关注困难样本。在标准数据集ICDAR2015和ICDAR2017上进行评估,实验结果表明提出的双塔结构模型能有效提高网络对文字区域的检测准确度。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分