基于异源数据的微博好友推荐
作者单位:浙江大学
学位级别:硕士
导师姓名:卜佳俊;王灿
授予年度:2013年
学科分类:081203[工学-计算机应用技术] 08[工学] 080402[工学-测试计量技术及仪器] 0804[工学-仪器科学与技术] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:在互联网时代,微博作为一种全新的社会化媒体,对人们日常生活的影响越来越大。然而随着微博爆炸式的增长,商业级的微博系统通常都具有大量的用户和多样化的信息。如何从海量的微博信息中,给每个用户提供其感兴趣的信息,就显得至关重要。 目前在个性化推荐领域,传统的商品推荐研究比较成熟,微博好友推荐相关的研究却较少,已有的微博好友推荐技术几乎都是基于单一数据源,推荐效果非常有限。本文在国内外相关研究的基础上,针对微博系统信息源多样化的特点,提出了适合微博好友推荐的算法模型。 本文首先对传统电子商务领域中的推荐技术进行了研究,阐述了协同过滤类的技术,包括基于邻居的协同过滤和基于模型的协同过滤。然后对目前已有的两类微博好友推荐技术进行了研究,包括基于社交拓扑结构的推荐和基于微博内容的推荐。本文重点阐述了协同过滤类技术中的潜在因子模型及各种变种,在此基础上,提出了能够整合多种数据源特征的推荐算法模型GLFM,并用该模型模拟了各种潜在因子模型。基于GLFM模型,对于新加入的数据源,只需要定义好输入特征即可,不需要重新设计实现算法。对于各种常见的微博数据源,如社交网络、人口统计、微博内容、时序信息等,本文给出了特征提取的方法,并将GLFM模型应用到了微博好友推荐系统上。实验表明,GLFM模型能够有效的整合等多种数据源特征,并显著的提高推荐质量。