融合领域知识短语树核函数的中文领域实体关系抽取
Chinese domain entity relation extraction based on domain knowledge phrasal tree作者机构:昆明理工大学信息工程与自动化学院昆明650504 昆明理工大学智能信息处理重点实验室昆明650504
出 版 物:《南京大学学报(自然科学版)》 (Journal of Nanjing University(Natural Science))
年 卷 期:2015年第51卷第1期
页 面:181-186页
核心收录:
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金(61175068) 云南省教育厅基金重大专项项目(KKJI201203001) 云南省应用基础研究计划重点项目(2013FA030)
摘 要:针对在核函数方法中,传统短语树只包含通用领域信息难以训练出适应特定领域关系抽取模型的问题,本文提出一种融入领域知识短语树的中文领域实体关系抽取方法.基于Web上中文特定领域网站的信息结构特点,构建出能反映特定领域实体语义关系的领域知识树,并将其融合到实例句的句法树中,得到特定领域实体语义树.然后通过支持向量机训练,得到实体关系的分类模型,对特定领域实体关系进行抽取.在收集的600篇旅游领域语料上进行关系抽取实验,结果表明:本文所提出的方法优于不融入领域信息的方法,F值提高了3.4%.