脱机印刷体彝族文字识别系统的原理与实现
Principles and Implementation of an Off-Line Printed Yi Character Recognition System作者机构:中南民族大学计算机科学学院少数民族语言文字信息处理实验室湖北武汉430074 中科院自动化所北京100086
出 版 物:《计算机技术与发展》 (Computer Technology and Development)
年 卷 期:2012年第22卷第2期
页 面:85-88,92页
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金面上项目(60975021) 中南民族大学中央高校基本科研业务费专项资金项目(ZZY10007) 中南民族大学自然科学基金项目(YZY07001)
主 题:彝文识别 字符分割 周边方向贡献度 特征压缩 字典匹配
摘 要:脱机印刷体彝文文字识别系统包括字符分割、特征提取、特征压缩以及字典匹配四个主要模块,该系统利用总结出的彝文字符合并和反合并规则提高了字符分割准确率,采用1024维周边方向贡献度作为彝文字符统计特征,对彝文中存在的大量相似字符具有良好的区分能力。系统还采用基于KL变换的特征压缩算法和三级字典快速匹配算法,最终实现了一个基于Windows平台的脱机印刷体彝文识别平台,该平台对样本的一次识别率在99.4%以上。实验结果表明这些方法是可行的和高效的。