中文Base NP识别:错误驱动的组合分类器方法
Chinese Base NP Chunking by Error-driven Combination Classifiers作者机构:中国科学院自动化研究所模式识别国家重点实验室北京100080 诺基亚中国研究中心北京100013
出 版 物:《中文信息学报》 (Journal of Chinese Information Processing)
年 卷 期:2007年第21卷第1期
页 面:115-119页
核心收录:
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金资助项目(60575043 60375018 60121302) 诺基亚中国研究中心资助项目
主 题:计算机应用 中文信息处理 错误驱动 中文Base NP识别 组合分类器
摘 要:本文采用一种新的错误驱动的组合分类器方法来实现中文Base NP识别。本文首先对中文和英文BaseNP识别技术现状进行了简要分析和概述,明确了中文Base NP识别的任务,然后,基于前人的工作提出了错误驱动的组合分类器方法,其基本思路是:通过对比两种不同类型的分类器—基于转化的方法和条件随机场方法的分类结果,再利用支持向量机学习其中的错误规律,对两分类器产生的不同结果进行纠错,从而达到提高系统整体性能的效果。我们在宾州中文树库转化得到的Base NP语料集上进行了Base NP识别交叉验证实验,与单独使用基于转化的方法、条件随机场方法以及支持向量机方法相比较,错误驱动的组合分类器方法的实验结果都有所提高,最佳结果F值达到了89.72%,相对于文中Base NP识别的其他方法,最大提高幅度为2.35%。