咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >文本中心像素重建实现任意形状的文本检测 收藏

文本中心像素重建实现任意形状的文本检测

Text Center Pixel Reconstruction to Achieve Efficient Arbitrary Shape Text Detection

作     者:雷小唐 胡靖 LEI Xiaotang;HU Jing

作者机构:成都信息工程大学计算机学院成都610000 

出 版 物:《计算机工程与应用》 (Computer Engineering and Applications)

年 卷 期:2023年第59卷第8期

页      面:148-156页

核心收录:

学科分类:08[工学] 081203[工学-计算机应用技术] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家自然科学基金(61602065) 四川省科技厅重点研发项目(2021YFG0038)。 

主  题:图像级上下文 语义级上下文 像素聚类 任意形状文本 文本核 

摘      要:针对自然场景文本检测算法未能高效、准确地实现端到端的任意形状文本检测,提出了轻量型像素聚类文本核重建的文本检测算法,针对轻量型网络特征信息弱和感受野小的问题,设计了图像级上下文信息模块(imagelevel context module)来捕获全局图像信息和语义级上下文信息模块(semantic-level context module)学习目标区域信息,两者信息融合增强网络特征信息保证检测的准确性,为了有效区分相邻文本和定位弯曲文本,基于文本核启发将文字实例中心视为聚类中心,从核中心经过一次像素聚类重建完整的文字实例实现对任意形状文本的检测。方法在弯曲文本数据集Total-Text和CTW1500综合评分达到了84.1%和84.6%超过了最好的CARFT方法,检测速度42帧/s超过最优EAST的,有效地解决了检测形状文本的高效和准确性,在应用层面更加友好。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分