基于分隔符和上下文术语的领域现象术语抽取
Extraction of Domain-Specific Phenomenal Terms Based on Separator and Contextual Terms作者机构:北京理工大学计算机学院北京100081
出 版 物:《华南理工大学学报(自然科学版)》 (Journal of South China University of Technology(Natural Science Edition))
年 卷 期:2011年第39卷第7期
页 面:146-149,155页
核心收录:
学科分类:1305[艺术学-设计学(可授艺术学、工学学位)] 0810[工学-信息与通信工程] 13[艺术学] 08[工学] 081104[工学-模式识别与智能系统] 0804[工学-仪器科学与技术] 0805[工学-材料科学与工程(可授工学、理学学位)] 081101[工学-控制理论与控制工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:术语抽取 分隔符 复合词 NC-value算法
摘 要:领域现象术语常常是复合型短语,很难根据局部上下文特征用传统的机器学习方法来抽取.为此,文中提出了一种领域现象术语的抽取方法.该方法首先用基于上下文的方法抽取得到分隔符集,然后结合分隔符集和上下文术语用改进的NC-value算法进行候选领域现象术语抽取,最后在候选领域现象术语中过滤掉名词性术语,进而得到最终结果.实验表明,文中方法对领域现象术语的抽取效果优于基于词频的方法和基于分隔符的方法.