深度学习及其在手写汉字识别中的应用研究
作者单位:华南理工大学
学位级别:硕士
导师姓名:高学
授予年度:2014年
学科分类:1305[艺术学-设计学(可授艺术学、工学学位)] 13[艺术学] 081104[工学-模式识别与智能系统] 08[工学] 0804[工学-仪器科学与技术] 081101[工学-控制理论与控制工程] 0811[工学-控制科学与工程]
摘 要:手写汉字识别作为人机交互的重要部分,解决这一关键难题具有非常重要的实用价值。汉字识别由于类别数量巨大,字形结构复杂,同时存在大量字形相似的汉字,书写方式因人而异等,在模式识别领域一直是难点和研究热点。深度学习主要包含深信度网络(Deep Belief Network, DBNs)、卷积神经网络(Convolutional Neural Networks, CNNs)两类模型,具有自动获取样本概率分布或者学习样本特征的优势,可以避免手写汉字字形特征提取的难题,但同时又具有训练困难的难题,本文研究了深度学习理论,特别是卷积神经网络模型应用于手写汉字识别的方法,并且针对训练难题做了改进和尝试。 通过研究脱机手写汉字识别系统识别率提升的瓶颈问题发现,手写汉字识别率低的原因主要在于相似手写汉字字形难以提取区分性特征。本文将CNNs模型用于10类别的相似手写汉字的识别,并提出了采用随机弹性形变的方法扩展汉字样本,提高了CNNs模型的泛化能力。通过与传统手写汉字识别方法对于相似汉字识别性能的对比实验表明,CNNs模型能够取得较高的识别率,避免了特征提取的难题;基于随机弹性形变的样本扩展能够有效提高用于手写汉字识别的CNNs模型的泛化能力。 针对CNNs模型对于不同类别数目进行性能测试实验,绘制了CNNs模型对于不同类别数目的手写汉字识别问题的性能曲线,指出了增大CNNs的模型规模来解决手写汉字识别问题的方案。针对CNNs模型规模增大,导致训练困难的问题,提出了一种类别累加的模型学习方式,即首先利用小类别的样本对CNNs模型进行预训练,将学习得到的模型保留作为更多类别训练的初始模型,然后逐渐增加类别对模型进行训练。采用这种训练方式,能够使CNNs模型学习过程迅速收敛。针对500类别的手写汉字识别实验结果表明,CNNs模型的学习次数降低为原来方法的25%,同时识别错误率相对降低17%至40%,验证了本文方法的有效性。