词性标注规则的获取和优化
作者单位:中文信息处理实验室
会议名称:《第一届学生计算语言学研讨会》
会议日期:2002年
学科分类:0502[文学-外国语言文学] 05[文学] 050211[文学-外国语言学及应用语言学]
基 金:国家863计划项目资助(863-301-7-7-B)
摘 要:本文提出一种词性标注规则自动学习算法。通过对规则进行评价、优化,有效提高标注正确率和标注效率。系统对PFR标注语料库(98年1月)进行标注,相对于NA假设的词性兼类消歧模型标注结果,封闭测试正确率提高了5.53%,开放测试提高了4.57%。