汉字识别中正确识别率与识别速度的探讨
出 版 物:《通信学报》 (Journal of China Institute of Communications)
年 卷 期:1986年第5期
页 面:53-58页
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:正确识别率 识别速度 汉字识别 汉字集 离散信源 无记忆信道 传输模型 计算公式 标准图形 文字识别
摘 要:本文把汉字识别归结为无记忆信道对离散信源的信息传输模型。由此出发导出了正确识别率、识别速度的计算公式,分析了影响正确识别率和识别速度的各种因素。给出了正确识别率与被识别字域大小的关系曲线。曲线表明,出现概率越大的汉字对正确识别率的贡献也越大。在汉字综合频度表的6763个汉字中,出现概率大的前4081个汉字对正确识别率的贡献为99.9%,而余下的2682个汉字对正确识别率的贡献仅仅为0.1%。 文中还对提高识别速度的途径进行了探讨,并作了模拟实验,给出了具有启示性的实验结果。