咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于深度学习的水表数字检测与识别模型研究 收藏
基于深度学习的水表数字检测与识别模型研究

基于深度学习的水表数字检测与识别模型研究

作     者:欧阳犇 

作者单位:南昌大学 

学位级别:硕士

导师姓名:张远来;邱桃荣

授予年度:2024年

学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 08[工学] 081104[工学-模式识别与智能系统] 080203[工学-机械设计及理论] 0802[工学-机械工程] 0835[工学-软件工程] 0813[工学-建筑学] 0814[工学-土木工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

主      题:水表读数识别 语义分割 样本加权 动态卷积 注意力机制 

摘      要:随着我国智慧水利的发展,传统抄水表方法已不能满足现代社会智能化的需求,因而基于深度学习的自动抄水表研究和开发成为一种新的趋势。然而,如何快速而准确的从水表表盘中提取读数区域,并对读数区域的数字进行检测和识别是该领域的主要问题。为了实现水表数字智能化识别,本文提出了基于深度学习的方法构建检测水表读数区域和识别读数区域的数字字符的模型。本文的主要研究内容如下: (1)水表表盘数据集与读数区域数据集的构建与预处理。对自制数据集进行初步预处理,针对图像光照环境复杂、对比度低、质量模糊以及噪声问题进行预处理。一是引入灰度化降低颜色对后续模型的影响;二是采用限制对比度自适应直方图均衡化提高图像的对比度;三是使用双边滤波对图像噪音进行去除,构建原始水表表盘数据集同时基于水表表盘数据集使用模型。分割出水表读数区域,构建读数区域数据集。 (2)水表表盘读数区域分割模型的构建。针对Deep Labv3+模型对水表表盘读数区域的边缘分割不精确和网络参数量大等问题,进行了一系列改进。首先,使用Mobile Net V2替换主干网络中的Xception,使用深度可分离卷积替代解码器中的普通卷积,旨在降低网络参数、减少计算量。其次,引入空洞空间金字塔池化(ASPP)的空洞率组合优化技术,旨在提升网络的分割效果。实验结果表明,改进后的模型能保证完成分割任务并使得模型轻量化。 (3)水表读数区域数字识别模型的构建。首先,针对模型过度关注高质量图像造成的过拟合问题,本文引入了样本加权函数,通过结合Wise-Io U的动态聚焦机制来改进样本加权函数,使得其能更加聚焦于可学习的复杂样本。其次,针对水表读数区域的数字呈多变、弯曲的特征,现有模型无法对其特征进行有效提取的问题,引入动态蛇形卷积,该卷积能够灵活地调整卷积核的形状,以适应水表读数区域数字字符的特征。最后,为适应模型的轻量级需求,使用深度可分离卷积替代部分标准卷积以减少参数,并使用坐标注意力机制与高效通道注意力机制替换模型中的部分模块,为模型提供坐标与空间的特征信息。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分