咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >联机手写汉字串的部件拆分识别方法研究 收藏
联机手写汉字串的部件拆分识别方法研究

联机手写汉字串的部件拆分识别方法研究

作     者:李春娣 

作者单位:哈尔滨工业大学 

学位级别:硕士

导师姓名:刘家锋

授予年度:2006年

学科分类:1305[艺术学-设计学(可授艺术学、工学学位)] 13[艺术学] 08[工学] 081104[工学-模式识别与智能系统] 0804[工学-仪器科学与技术] 081101[工学-控制理论与控制工程] 0811[工学-控制科学与工程] 

主      题:手写汉字串 部件 分层构筑 动态时间归正 解码 

摘      要:在现代社会中,随着互联网和无线互联网的发展,各种移动信息终端设备(如PDA, HPC)得到了广泛的应用,联机手写输入日益成为一种重要的输入手段。联机连续手写体字符识别是手写体识别的发展趋势。从目前联机汉字识别技术的发展来看,大多数的识别系统主要是针对单个汉字字符进行识别的,首先需要对连续输入的字符进行分割,分割为单字符数据,然后由单字符识别引擎进行识别。上述系统的性能主要决定于能否将连续输入语句分割为单个字符。现有的分割算法大多是依赖于字符之间的空间分离性,能否正确分割就决定于书写时字符之间的间隔能否满足分割算法的要求,因此现有的联机识别系统大多对于字符之间具有粘连或分离的情况会分割失败或存在过切分。 针对现有识别系统的这些弱点,本文提出将分层构筑(Level Building, LB)和动态时间归正(Dynamic Time Warping, DTW)算法相结合(LB DTW)的联机手写汉字串识别方法。LB DTW算法不需要预先将连续输入的字符预分割为单字字符数据,而直接将连续输入的待测字符序列与所有参考模式进行DTW匹配识别。LB算法根据参考模式与待测片段的DTW匹配识别结果将连续的待测序列分割为连续的层,每层对应一个参考部件模式。由于LB DTW算法将字符分割识别同步进行,字符分割是基于上一层字符识别结果的,分割错误可以根据识别信息得到纠正,并且统计语言信息可以融合到LB算法分层之间进行优化搜索。 针对连续汉字字符识别,本文抽取汉字的手写体部件字符作为结构子模式,建立了手写体汉字部件字符集,完成了GB2312-80中6,763个汉字的部件编码并做了数据统计工作。LB算法将连续的手写体序列进行基于部件的分割和识别,识别为部件串序列,再进一步解码为汉字序列。 LB DTW算法对手写体字形的变化不敏感,字符分割不过分依赖于字符的空间分离性,系统的性能关键在于待测片段与参考模式的识别结果,而现有的单字符识别器已经达到了一个较高的识别率。实验结果表明该方法对连续多字手写体有较好的识别效果。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分