实体—属性抽取的GRU+CRF方法
Entity-Attribute Extraction with GRU+CRF Method作者机构:华东师范大学经济与管理学部信息管理系上海200241
出 版 物:《现代情报》 (Journal of Modern Information)
年 卷 期:2018年第38卷第10期
页 面:57-64页
核心收录:
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家社会科学基金项目"基于数据驱动的图书馆资源发现系统平台研究"(项目编号:16BTQ026)
主 题:实体属性抽取 GRU 循环神经网络 条件随机场 命名实体识别
摘 要:[目的/意义]研究利用深度学习的循环神经网络GRU结合条件随机场CRF对标注的中文文本序列进行预测,来抽取在线评论文本中的实体—属性。[方法 /过程]首先根据设计好的文本序列标注规范,对评论语料分词后进行实体及其属性的命名实体标注,得到单词序列、词性序列和标注序列;然后将单词序列、词性序列转为分布式词向量表示并用于GRU循环神经网络的输入;最后输出层采用条件随机场CRF,输出标签即是实体或属性。[结果/结论]实验结果表明,本文的方法将实体—属性抽取简化为命名实体标注,并利用深度学习的GRU捕获输入数据的上下文语义以及条件随机场CRF获取输出标签的前后关系,比传统的基于规则或一般的机器学习方法具有较大的应用优势。