基于图像识别的试卷成绩复核系统关键技术研究
作者单位:辽宁工程技术大学
学位级别:硕士
导师姓名:任晓奎
授予年度:2019年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 080203[工学-机械设计及理论] 0835[工学-软件工程] 0802[工学-机械工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:图像识别 颜色特征 手写字符串识别 多分类器 Lenet-5
摘 要:试卷成绩复核工作存在于各个阶段的教育中,而传统的复核方式主要依赖于人类劳动。人工复核试卷成绩时存在以下问题:(1)教师们均为高素质人才,若将大量时间耗费在这项工作中,是一种人力资源的浪费。(2)人长时间重复一件事情,不仅工作效率低,还会增加出错的可能性。为解决以上问题,本文设计了一个试卷成绩自动复核系统。该系统分为两部分,单元格数据提取和分数识别复核。传统分数识别方法先将图像二值化再提取分数,然后将分数分割成单个数字再识别。但由于分数提取算法复杂,数字间存在连笔的情况,粘连分数分割点难以确定,易出现误分割情况。为了解决以上问题,本文利用分数与其他内容颜色不同,并运用数学形态学算法,实现单元格数据的完整提取。为避免单元格内分数的误分割,本文提出了一种多分类器下无分割手写数字字符串识别的改进算法。该算法设计了两种分类器,一个长度分类器和两个数字分类器。采用长度分类器获取字符长度信息,利用字符长度信息将其送入到对应长度的数字分类器,通过三个分类器的共同合作,完成分数识别,实现成绩复核。使用自建孤立数字数据集和粘连两位数字数据集,将传统Lenet-5网络进行改进,训练出三个分类器模型。对比实验表明,多分类器下无分割手写数字字符串的识别算法与传统分割识别算法相比,在识别2、3、4、5、6位长度的字符串时,其识别准确率均有不同程度的提高。本系统试卷复核准确率为98.2%,与几种采用分割法识别分数的复核系统相比,准确率分别提高了2.2%,7.71%,4.95%,6.4%,具有一定的实用价值。该论文有图49幅,表11个,参考文献55篇。