基于有监督主题模型的排序学习算法
Rank Learning Based on Supervised Topic Model作者机构:哈尔滨工业大学深圳研究生院广东深圳518055 计算机体系结构国家重点实验室中科院计算所北京100190
出 版 物:《电子学报》 (Acta Electronica Sinica)
年 卷 期:2015年第43卷第2期
页 面:333-337页
核心收录:
学科分类:0839[工学-网络空间安全] 08[工学] 081201[工学-计算机系统结构] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金(No.61100192) 中科院计算机体系结构国家重点实验室开放基金 哈工大学科研创新基金(No.HIT.NSRIF2010123) 哈工大深圳研究生院网络智能计算重点实验室资助
摘 要:文档表示是排序学习的关键,目前的排序学习算法多采用词袋法表示文档与查询,该方法假设词袋中的词相互独立,忽略了词之间的关系.为了表示文档中词之间的依赖关系,本研究利用文档与查询的主题特征构建排序学习模型,我们将排序函数定义为文档与查询之间的主题关系,提出了基于有监督主题模型的排序学习算法自动学习排序函数.为了评价模型的排序精度,我们在三个标准数据集(OHSUMED,MQ2007,MQ2008)上进行了实验.实验表明基于主题的排序学习算法能够发现文档与查询之间内在的语义关联,并改善排序模型的排序精度.