基于词嵌入与扩展词交集的查询扩展
Expanding Queries Based on Word Embedding and Expansion Terms作者机构:广西财经学院广西跨境电商智能信息处理重点实验室南宁530003 广西财经学院信息与统计学院南宁530003
出 版 物:《数据分析与知识发现》 (Data Analysis and Knowledge Discovery)
年 卷 期:2021年第5卷第6期
页 面:115-125页
核心收录:
学科分类:1205[管理学-图书情报与档案管理] 12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 08[工学] 120502[管理学-情报学] 081201[工学-计算机系统结构] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金项目(项目编号:61762006)的研究成果之一
摘 要:【目的】针对信息检索中词不匹配问题,提出一种词嵌入与扩展词交集融合的查询扩展模型。【方法】对初检文档集进行词嵌入学习训练和关联规则挖掘,分别得到词嵌入候选扩展词集和挖掘候选扩展词集,将这两种候选扩展词集进行交集融合得到最终扩展词集,实现查询扩展。【结果】实验结果表明,所提扩展模型检索结果MAP和P@5高于基准检索,与近年同类查询扩展方法比较,其MAP和P@5平均增幅范围分别为0.96%~31.24%和1.07%~13.55%。【局限】只进行实验性研究,需要继续探讨在实际信息检索系统中的具体应用。【结论】所提模型能提高扩展词质量,改善检索性能,遏制查询主题漂移和词不匹配问题。