社交网络潜在热点推荐系统的研究与实现
作者单位:哈尔滨工业大学
学位级别:硕士
导师姓名:张宏莉
授予年度:2017年
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:随着移动互联网的快速发展,社交网络已经深入人们的日常生活,网民可以随时随地通过社交网络发表自己对周围生活、时事热点等的观点看法,然而社交网络海量的内容为用户提供信息的同时,也带来了信息过载等问题,用户很难快速而准确地找到自己感兴趣的信息,搜索引擎的被动和非智能性也越来越难以满足用户的需求,因此性化推荐系统应运而生。而在推荐系统中,面对的数据量往往是巨大的。为了快速响应用户需求,本文通过HDFS、Spark和SolrCloud等大数据技术的整合,提供高可靠和高性能的分布式存储、计算和检索环境,提高推荐系统的运行效率和稳定性。本文以社交网络为背景,面对的系统用户主要是相关部门的舆情分析人员,推荐其感兴趣的人或主贴,帮助其及时获取民众关心的热点和舆论倾向。首先介绍了课题的相关背景和意义,然后深入探讨了相关的大数据技术,同时介绍了常用的推荐算法。最后结合大数据处理技术,设计实现了一个社交网络混合推荐系统。本论文的主要工作内容有:1.实现了微博、Twitter和Facebook三个通道长期稳定的社交网络历史信息采集程序,为社交网络的舆情分析和推荐提供数据源。2.实现了基于社交网络的混合推荐引擎。为解决冷启动、物品非流行等问题,设计实现了基于用户兴趣关键词,基于博文内容和基于社交网络关系的推荐引擎,并采用加权并行的方式混合产生个性化推荐结果,最后对结果进行过滤、排序和解释。3.搭建了稳定的大数据运行平台,提供良好的推荐交互界面,完成整体推荐系统的运行测试。