统计和规则相结合的汉语组块分析
CHINESE CHUNKING PARSING USING RULE-BASED AND STATISTICS-BASED METHODS作者机构:中国科学院计算技术研究所北京100080
出 版 物:《计算机研究与发展》 (Journal of Computer Research and Development)
年 卷 期:2002年第39卷第4期
页 面:385-391页
核心收录:
学科分类:0810[工学-信息与通信工程] 0808[工学-电气工程] 0839[工学-网络空间安全] 081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家"九七三"重点基础研究项目基金资助(G1998030507-4)
主 题:统计 规则 汉语组块分析 语料库 自然语言处理 计算机
摘 要:从文本中获得的组块对机器翻译、信息检索等很多领域都非常有用.介绍了规则和统计进行组块分析的处理策略,提出了规则与统计相结合的处理方法.并且结合组块分析的实际情况改进了一般评价系统性能的指标,通过封闭测试和开放测试验证,与单纯规则组块划分相比较,组块识别的精确率和召回率都得到了提高,组块划分错误率降低了7%.