基于加权子序列核函数的次范畴论元分析
Arguments analysis of Chinese verb subcategorization based on weighted gap subsequence kernel function作者机构:哈尔滨工业大学教育部-微软语言语音重点实验室哈尔滨150001 黑龙江大学计算机科学与技术学院哈尔滨150080
出 版 物:《高技术通讯》 (Chinese High Technology Letters)
年 卷 期:2010年第20卷第2期
页 面:127-132页
核心收录:
学科分类:0810[工学-信息与通信工程] 12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0805[工学-材料科学与工程(可授工学、理学学位)] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金(60773069 60973169)资助项目
主 题:汉语动词次范畴(SCF) 论元分析 主动学习 间隔加权子序列
摘 要:为提高汉语动词次范畴化框架(SCFs)的分析性能,提出了一种新的次范畴论元分析方法。该方法引入了基于间隙加权子序列的核函数,以传统规则的右部作为分类类别,将规则左部作为问题输入空间,将原本规则推导的问题转化为机器学习问题。由于间隙加权子序列核函数可以考虑跨距离的词之间的依赖关系,加之机器学习方法的引入,使得论元识别精度从55.16%提到了93.43%,并且极大提高了次范畴整句获取精度。