基于聚类和用户点击的在线多样化排序算法
Online Diversified Ranking Algorithm Based on Clustering and User Clicks作者机构:华南理工大学计算机科学与工程学院广东广州510006
出 版 物:《华南理工大学学报(自然科学版)》 (Journal of South China University of Technology(Natural Science Edition))
年 卷 期:2011年第39卷第12期
页 面:70-74,99页
核心收录:
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:广东省教育部产学研结合项目(2011B090400032) 教育部高等学校博士学科点专项科研基金资助项目(20110172120027) 广东省自然科学基金资助项目(9451064101003233) 广东省电子商务市场应用技术重点实验室开放基金资助项目(2011GDECOF01) 华南理工大学中央高校基本科研业务费专项资金资助项目(2009ZM0125 2009ZM0189 2009ZM0255)
摘 要:在互联网信息检索中,多样化排序方法力求在排序结果列表靠前的位置为用户提供多样的结果文档.文中提出一种基于聚类和用户点击的在线多样化排序算法CRBA,通过结合文档的相似性以及用户的点击反馈,在与用户的不断交互中为用户提供多样化的排序结果.该算法将在线和离线的思想进行融合,既可以利用主题聚类的优点,根据主题对候选文档集合进行简单的划分,大大加快了算法收敛速度,又能发挥在线排序算法的优点,利用用户点击反馈,获得对用户意图更为准确和完整的估计.实验结果表明,与其它在线排序算法相比,CRBA算法收敛速度快,且具有适应现实搜索环境中文档数量大的特点.