基于词向量的化学领域知识发现初步研究
Preliminary Research on the Knowledge Discovery in Chemistry Based on the Word Embedding作者机构:华东理工大学科技信息研究所
出 版 物:《图书馆杂志》 (Library Journal)
年 卷 期:2018年第37卷第11期
页 面:90-98页
核心收录:
学科分类:1205[管理学-图书情报与档案管理] 12[管理学] 120501[管理学-图书馆学] 07[理学] 0703[理学-化学] 120502[管理学-情报学]
基 金:国家社科基金一般项目"面向知识服务的学科领域术语语义分析及应用研究"(项目编号:13BTQ053) 教育部人文社会科学研究一般项目"面向语义出版的富语义模型构建与应用研究"(项目编号:15YJC870014)的研究成果之一
摘 要:在文本数据中,知识的表示具有抽象性、非结构化[1]、潜在性等特点,通过共现[2]、规则[3]和关联[4]等数据挖掘方式很难在体现词的语义性和句子的语法性下进行知识发现工作。本文在Word2Vec的基础上提出添加词属性的WP-Word2Vec模型,并依据词向量设计知识发现模型。通过实验表明WP-Word2Vec模型在训练词向量时能够融入词类别信息,在相应的相似词发现中相似度有所提高。