基于网页概率潜在语义信息的用户兴趣聚类
User's interest clustering based on webpage probabilistic latent semantic information作者机构:江南大学物联网工程学院江苏无锡214122
出 版 物:《计算机工程与科学》 (Computer Engineering & Science)
年 卷 期:2014年第36卷第4期
页 面:765-771页
核心收录:
学科分类:0810[工学-信息与通信工程] 08[工学] 080401[工学-精密仪器及机械] 0804[工学-仪器科学与技术] 080402[工学-测试计量技术及仪器] 0835[工学-软件工程] 081002[工学-信号与信息处理]
基 金:国家自然科学基金资助项目(61103129) 江苏省科技支撑计划资助项目(BE2009009)
主 题:概率潜在语义分析 自动相似度阈值选择 用户兴趣点 凝聚式层次k中心点 个性化服务
摘 要:为了能准确挖掘用户兴趣点,首先利用概率潜在语义分析PLSA模型将网页-词矩阵向量投影到概率潜在语义向量空间,并提出自动相似度阈值选择方法得到网页间的相似度阈值,最后提出将平面划分法与凝聚式层次聚类相结合的凝聚式层次k中心点HAK-medoids算法,实现用户兴趣点聚类。实验结果表明,与传统的基于划分的算法相比,HAK-medoids算法聚类效果更好。同时,提出的用户兴趣点聚类技术在个性化服务领域可提高个性化推荐和搜索的效率。