基于规则和统计的汉语多输出切分系统
A Multi-Output Chinese Segmentation System Based on Rules and Statistic作者机构:上海工程技术大学计算机系上海201620 郑州市艺术工程学校河南郑州450000
出 版 物:《微电子学与计算机》 (Microelectronics & Computer)
年 卷 期:2007年第24卷第7期
页 面:56-58页
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:介绍了一个对汉语语料进行切分加工的系统,该系统结合了规则和统计两类方法,可以按多种方法输出切分结果,并根据概率信息在分词阶段就对歧义进行适当处理,并可保留少数在分词阶段无法确定的歧义留待后继层面上的分析加工。