咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于YOLOv8n的表格线检测改进模型 收藏

基于YOLOv8n的表格线检测改进模型

作     者:韦超 钱春雨 黄启鹏 杜林轩 杨哲 

作者机构:苏州大学计算机科学与技术学院 

出 版 物:《计算机工程与应用》 (Computer Engineering and Applications)

年 卷 期:2024年

学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 08[工学] 081104[工学-模式识别与智能系统] 080203[工学-机械设计及理论] 0802[工学-机械工程] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家级大学生创新创业训练计划项目(202210285042Z) 

主  题:表格线 YOLOv8n 注意力机制 动态蛇形卷积 Transformer 轻量化 

摘      要:在表格识别重构任务中,分割和合并的重构方法需要通过检测表格线进而重构出电子表格,因此表格线检测结果的质量直接决定了表格重构的效果。针对已有方法存在误检漏检的问题,提出一种YOLOv8n改进模型,用于表格线检测。在主干网络中,利用Swin Transformer的思想改进BottleneckCSP模块,可以捕捉到更长距离的上下文信息,提升对于大尺度表格线的识别能力;针对表格线细长密集的特点,引入蛇形动态卷积的思想改进C2f(CSPLayer_2Conv)模块,根据特征之间的空间关系自适应地调整卷积核的形状和位置,从而更好地捕获特征之间的相关性和局部细节,进而提高特征建模能力;通过CBAM(Convolutional Block Attention Module)注意力机制改造空间金字塔池化层,动态地调整特征图中每个通道和空间位置的重要性,从而增强特征图的区分能力;优化颈部结构,引入混洗卷积来改造颈部结构。实验结果表明,改进后的YOLOv8n模型在ICDAR_2013和PubTabNet数据集上,mAP@0.5-0.95、P、R分别提升了7.9%、30.1%、8.8%,性能超过YOLO同系列模型。这些改进使得YOLOv8n模型在表格线检测任务中展现出了优异的性能,通过与合并方法结合,可以进一步提升表格重构的效果。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分