咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于特征增强和自适应分割的集装箱文本识别算法研究 收藏
基于特征增强和自适应分割的集装箱文本识别算法研究

基于特征增强和自适应分割的集装箱文本识别算法研究

作     者:冯兴齐 

作者单位:武汉理工大学 

学位级别:硕士

导师姓名:刘清

授予年度:2021年

学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程] 

主      题:集装箱堆场 文本识别 特征增强 自适应分割 自矫正 注意力机制 

摘      要:研发集装箱后箱面净重、毛重等文本信息的识别技术是提高码头集装箱装卸效率,实现堆场作业自动化和智能化的关键环节。目前该领域现有识别算法主要以桥吊、闸口等位置的箱号为研究对象,但在堆场环境下,后箱面重量、体积等多类型密集排布的文本识别问题仍处于研究阶段。本文针对堆场集装箱后箱面的重量文本、体积文本及箱号文本识别任务展开研究,以开发鲁棒性强、精度高和速度快的算法为目标。在像素级分割的文本检测框架下,提出了基于特征增强和自适应分割的检测网络,并结合改进型MORAN端到端识别网络完成整体算法设计,最终得到一种鲁棒性强,兼顾高精度和高速度的集装箱文本识别算法。整体算法由检测和识别两个子系统而成,设计内容主要包含四个方面:(1)提出FPD-AN(Feature Pyramid Dilation-Attention Net)网络来实现特征增强功能。该网络以轻量化Shuffle Net_v2为骨干,利用高维特征对低维特征的加权计算来增强检测网络的特征表达能力,并采用空洞卷积和全局平均池化来扩大感受野。(2)采用自适应阈值分割后处理方式。设计可监督学习的阈值来高效完成文本边缘分割,从而解决文本密集分布和耗时长的问题,同时采用更倾向于挖掘前景区域的dice loss训练,以解决正负样本不平衡问题。(3)应用端到端识别网络MORAN解决文本的尺度不一、污损、残缺、畸变和遮挡等问题。其中通过矫正子网络MORN的像素级弱监督学习机制对倾斜、畸变文本进行矫正;通过识别子网络ASRN的注意力机制增强网络记忆功能。(4)设计基于Dense Net的特征提取网络改进MORAN算法,充分提高特征提取效率,提高算法的抗过拟合性和识别精度。本文数据集来自我国海洋大港集装箱堆场采集到的后箱面样本,经仿真结果表明,(1)(2)两项设计使集装箱文本检测准确率达到89.74%,F1 score和FPS分别为0.909和7.61;(3)(4)两项设计使文本识别准确率达到96%,FPS为14.6。整体仿真识别率达到92.6%,FPS为13.5。相比现有像素级分割的PSENet+MORAN和DBNet+MORAN识别算法,本文算法在保持速度优势的同时,在精度上分别提高了4.1%和8.3%,基本达到了预期指标。最后,开发应用程序并进行现场调试。经工程测试可知,本文算法识别精度可达到90%,单帧识别时间在600ms内,能有效解决识别精度和速度的平衡问题,满足堆场集装箱装卸作业的实际需求。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分