基于深度学习的铸件字符检测算法研究与应用
作者单位:北方民族大学
学位级别:硕士
导师姓名:马行
授予年度:2024年
学科分类:12[管理学] 080503[工学-材料加工工程] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 080203[工学-机械设计及理论] 0805[工学-材料科学与工程(可授工学、理学学位)] 0835[工学-软件工程] 0802[工学-机械工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 080201[工学-机械制造及其自动化]
摘 要:随着智能化生产模式的发展,企业生产效率显著提高。铸件序号的自动识别已成为工业生产研究的热点之一。生产线上产品信息的快速检测和识别是工业生产要求,但噪声环境、光照条件以及工业字符区域的随机性等因素均给字符识别带来困难。为解决难题,本文对基于深度学习的铸件字符检测方法进行研究,并选用低成本、小体积的嵌入式平台NVIDIA Jetson Xavier NX进行应用,主要研究内容如下:(1)基于YOLOv7-tiny网络研究铸件字符定位算法。引入ECA-Net模块以提升特征提取能力,通过全局平均池化和一维卷积计算注意力权重,从而提升模型的字符定位准确性。此外,通过将损失函数EIo U与Focal机制相结合,提高了检测的定位效率和准确性。优化后的算法模型取得了99.71的m AP值,0.90的定位精度和47.14FPS的检测速度。(2)基于CRNN网络研究铸件字符识别算法。针对工业环境中字符位置随机,背景复杂,字符大小形状颜色各异的问题,采用更深层的Dense Net替代VGG16作为特征提取网络,大幅提高了模型的鲁棒性和识别精度。升级后的CRNN-DN网络准确率可达96.6%,识别速度为62ms。(3)将YOLOv7-tiny与CRNN网络模型整合处理,并部署到嵌入式平台NVIDIA Jetson Xavier NX上,基于Py Torch框架实现应用了铸件字符定位识别算法。实验结果显示,对于铸件字符的检测率可达96.7%,模型的总大小约为45M,检测速度可达32fps。说明构建的铸件字符检测算法能有效实现铸件字符的检测,具有良好的铸件字符识别能力。