CRFs融合语义信息的英语功能名词短语识别
Identification of English Functional Noun Phrases by CRFs and the Semantic Information作者机构:大连理工大学外国语学院辽宁大连116024 大连理工大学计算机科学与技术学院辽宁大连116024
出 版 物:《中文信息学报》 (Journal of Chinese Information Processing)
年 卷 期:2016年第30卷第6期
页 面:59-66页
核心收录:
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:教育部人文社会科学研究规划基金(13YJAZH062)
主 题:功能名词短语 名词短语识别 条件随机域模型 语义信息
摘 要:名词短语识别在句法分析中有着重要的作用,而英汉机器翻译的瓶颈之一就是名词短语的歧义消解问题。研究英语功能名词短语的自动识别,则将名词短语的结构消歧问题转化成名词短语的识别问题。基于名词短语在小句中的语法功能来确定名词短语的边界,选择商务领域语料,采用了细化词性标注集和条件随机域模型结合语义信息的方法,识别了名词短语的边界和句法功能。在预处理基于宾州树库细化了词性标注集,条件随机域模型中加入语义特征主要用来识别状语类的名词短语。实验结果表明,结合金标准词性实验的F值达到了89.04%,改进词性标注集有助于提高名词短语的识别,比使用宾州树库标注集提高了2.21%。将功能名词短语识别信息应用到NiuTrans统计机器翻译系统,英汉翻译质量略有提高。