基于CRF的藏文地名识别技术研究
Research on Tibetan location Name Recognition Technology Under CRF作者机构:西藏大学信息科学技术学院拉萨850000 青海师范大学藏文信息处理教育部重点实验室西宁810008
出 版 物:《计算机工程与应用》 (Computer Engineering and Applications)
年 卷 期:2019年第55卷第18期
页 面:111-115页
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家重点研发计划重点专项(No.2017YFB1402200) 国家自然科学基金(No.61262051) 青海省科技计划项目(No.2017-GX-146,No.2017-ZJ-767) 西藏大学研究生“高水平人才培养计划”项目(No.2017-GSP-016)
摘 要:藏文地名识别是藏文命名实体识别中必须要解决的问题。通过分析藏文地名的特点及识别难点,阐述了藏文地名的音节、触发词、地名后续词和格助词等特性适用基于CRF模型的地名识别,通过实验,验证了6种特征对藏文地名识别的有效性。实验结果表明该方法对藏文地名识别的准确率、召回率和F值分别达到了96.12%、81.92%和88.45%,实验结果与已有的系统相比,取得了较好的效果。