“蒙古文同音同形同类词”知识库的构建
The Construction of Mongolian Homographs Knowledge Base作者机构:内蒙古大学蒙古学学院呼和浩特010021
出 版 物:《中央民族大学学报(哲学社会科学版)》 (Journal of Minzu University of China(Philosophy and Social Sciences Edition))
年 卷 期:2010年第37卷第4期
页 面:106-110页
核心收录:
学科分类:0501[文学-中国语言文学] 0304[法学-民族学] 03[法学] 05[文学] 050107[文学-中国少数民族语言文学(分语族)]
基 金:教育部 国家语委民族语言文字规范标准建设及信息化项目"蒙古语语言知识库的建立"(MZ115-038) 的设计与实现"(60873084)资助">"国家自然科学基金项目"<蒙古语语义信息词典>的设计与实现"(60873084)资助
摘 要:同音同形同类词是蒙古文词汇的重要组成部分。据统计,蒙古文同音同形同类词在静态环境中占词典词条总数的5.1%,动态环境中占语料总词数的11.6%。蒙古文同音同形同类词知识库包括同音同形同类词信息词典及其管理维护工具、人工识别与标注同音同形同类词的100万词级现代蒙古语文数据库、同音同形同类词的搭配库、共现库、类语库、共现成分的统计工具、同音同形同类词的自动识别与标注工具等。本文基于共现库在测试集中自动识别标注了同音同形同类词,其识别标注召回率为99.8%,准确率为81.7%。