基于Word2Vec的WordNet词语相似度计算研究
Research onWordNetWord Similarity Calculation Based onWord2Vec作者机构:曲阜师范大学网络空间安全学院山东曲阜273100 曲阜师范大学物理工程学院山东曲阜273100
出 版 物:《计算机工程与应用》 (Computer Engineering and Applications)
年 卷 期:2022年第58卷第3期
页 面:222-229页
学科分类:08[工学] 081203[工学-计算机应用技术] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:山东省自然科学基金(ZR2017MD019) 教育部高教司产学合作协同育人项目(201701020098) 曲阜师范大学交叉学科研究项目(QFNUSKC291809120) 赛尔网络下一代互联网技术创新项目(NGII20190516)。
主 题:词语相似度 WordNet Word2Vec 同义词集标号
摘 要:当前大部分WordNet词语相似度计算方法由于未充分考虑词语的语义信息和位置关系,导致相似度的准确率降低。为解决上述问题,提出了一种使用词向量模型Word2Vec计算WordNet词语相似度的新方法。在构建WordNet数据集时提出一种新形式,不再使用传统的文本语料库,同时提出信息位置排列方法对数据集加以处理。利用Word2Vec模型训练WordNet数据集后得到向量表示。在公开的R&G-65、M&C-30和MED38词语相似度测评集上完成了词语相似度计算任务,从多个角度进行了Pearson相关系数对比实验。结果显示该文计算的相似度值与人工判定值计算取得的Pearson相关系数指标得到了显著提升。