印刷包装的文本检测与识别算法研究及其应用
作者单位:华中科技大学
学位级别:硕士
导师姓名:江国星
授予年度:2022年
学科分类:08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程] 0822[工学-轻工技术与工程]
摘 要:在食品、药品等领域,产品外包装上必须附带如生产日期、有效期限、生产批次等印刷文本,其重要意义是明确保质期、保留可追溯途径。存在错印、漏印等质量问题的印刷文本会给企业带来法律风险。传统人工抽检方式存在开销大、漏检率高的弊端,而使用机器视觉技术能够实现更智能、更高效的解决方案。本文研究端到端的文本检测识别算法,并研发了一个印刷文本视觉检测识别软件系统。主要工作如下:(1)针对激光打印文本存在对比度低的问题,提出了一种边缘增强网络,能抑制背景并增强文本特征;针对特征图融合时存在的权重不合理问题,提出了一种权重自调节网络,能根据当前特征图调整融合权重;针对标准非极大值抑制算法耗时长、处理倾斜文本框效果不佳的问题,提出了一种改进非极大值抑制算法,基于文本分布特性水平合并候选框,然后使用网络回归的角度,能实现倾斜框非极大值抑制。(2)为了解决密集连接引入的特征冗余问题,提出了一种随机丢弃网络,通过丢弃某些通道数据的方式降低网络的特征冗余。喷墨打印文本的字符间距存在波动,这会让字符分割变得困难,为了解决该问题,提出了一种文本识别网络,通过全卷积网络提取序列特征、连接时态分类算法解码特征,从而实现文本序列识别。(3)基于提出的文本检测和文本识别算法,本文研发了一个印刷文本视觉检测识别软件系统。基于分层和分模块的设计理念,软件系统分为用户交互层、应用层和功能模块层。软件系统实现了网络通信、一键检测识别、延时剔除等功能。在印刷文本数据集上测试本文提出的文本检测算法、文本识别算法以及端到端的文本检测识别方式的效果。本文提出的文本检测算法在F1分数上达到了0.92,相较于YOLOv3提升了0.038;文本识别算法的准确率达到了95%,相较于CRNN提升了2%;端到端的文本检测识别方式准确率达到了93%。本文所研发的印刷文本视觉检测识别软件系统准确率达到工厂要求,整体误检测率在0.4~0.6%范围内波动。