咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于查询语义特性的稠密文本检索模型 收藏

基于查询语义特性的稠密文本检索模型

Dense passage retrieval model based on query semantic characteristics

作     者:赵铁柱 林伦凯 杨秋鸿 Zhao Tiezhu;Lin Lunkai;Yang Qiuhong

作者机构:东莞理工学院计算机科学与技术学院广东东莞523808 东莞城市学院人工智能学院广东东莞523419 

出 版 物:《计算机应用研究》 (Application Research of Computers)

年 卷 期:2024年第41卷第5期

页      面:1388-1393页

学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:广东省普通高校重点领域专项资助项目(2021ZDZX3007) 东莞市社会发展科技资助项目(20231800936732) 东莞城市学院青年教师发展基金资助项目(2022QJY005Z) 

主  题:查询 稠密文本检索 近邻 对比学习 自监督 

摘      要:针对现有稠密文本检索模型(dense passage retrieval,DPR)存在的负采样效率低、易产生过拟合等问题,提出了一种基于查询语义特性的稠密文本检索模型(Q-DPR)。首先,针对模型的负采样过程,提出了一种基于近邻查询的负采样方法。该方法通过检索近邻查询,快速地构建高质量的负相关样本,以降低模型的训练成本。其次,针对模型易产生过拟合的问题,提出了一种基于对比学习的查询自监督方法。该方法通过建立查询间的自监督对比损失,缓解模型对训练标签的过拟合,从而提升模型的检索准确性。Q-DPR在面向开放领域问答的大型数据集MSMARCO上表现优异,取得了0.348的平均倒数排名以及0.975的召回率。实验结果证明,该模型成功地降低了训练的开销,同时也提升了检索的性能。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分