基于部件组合的联机手写“藏文—梵文”样本生成
Online Handwritten Sample Generated Based on Component Combination for Tibetan-Sanskrit作者机构:西北民族大学数学与计算机科学学院甘肃兰州730030 中国人民银行白银中心支行甘肃白银730900
出 版 物:《中文信息学报》 (Journal of Chinese Information Processing)
年 卷 期:2017年第31卷第5期
页 面:64-73页
核心收录:
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金(61375029) 国家民委领军人才计划 西北民族大学中央高校基本科研业务费专项资金(31920170142)
摘 要:藏文—梵文包括500多个现代藏文、6 000多个梵音藏文,在文字识别领域属于大类别的字符集,所以联机手写样本采集是庞大而复杂的工程。鉴于此,提供了一种基于部件组合的藏文—梵文手写样本生成方法,主要包括:(1)确定藏文—梵文字符集和部件集;(2)获取藏文—梵文字丁的部件位置信息;(3)采集联机手写藏文—梵文部件的样本;(4)生成联机手写藏文—梵文字符集样本库。该文为联机手写藏文—梵文识别的研究提供字符训练样本库和测试样本库,提高了手写梵音藏文样本采集效率,解决了样本数量及多样性问题,降低了样本采集成本,为进一步联机手写梵音藏文识别的研究与系统开发奠定了基础。