面向用户行为数据建模的推荐算法研究
作者单位:深圳大学
学位级别:硕士
导师姓名:彭小刚;潘微科
授予年度:2018年
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:随着互联网平台的不断发展,企业收集到的用户行为数据日益增多,面向用户行为数据建模的推荐算法研究成为热点之一。因为有效地解决用户行为数据建模问题能挖掘出更多有关用户的偏好信息,给用户推荐更加贴近其需求的产品或服务,从而提升用户满意度,也能给企业创造更多的收益。但在现实世界中,用户行为数据类型多样,不同类型的用户行为数据建模问题有相应的算法予以求解。目前大部分面向用户行为数据建模的推荐算法,是以矩阵分解技术为核心的协同过滤推荐算法,具体包括面向用户显式反馈数据建模的协同过滤推荐算法和面向用户隐式反馈数据建模的协同过滤推荐算法。已有的矩阵分解推荐模型虽有应对数据稀疏、实现不复杂等优势,但模型学习得到的是用户和物品间关联的全局信息,很难捕捉到用户或物品间关联的局部信息。此外,随着用户行为数据复杂程度的提高,面向用户行为数据建模的推荐算法研究也遇到了不小的挑战。针对上述存在的问题,本文从用户显式反馈数据建模、用户隐式反馈数据建模和用户消费行为数据建模三个具体问题来对面向用户行为数据建模的推荐算法进行深入研究。本文首先对面向用户显式反馈数据建模问题的推荐算法进行改进,提出了基于邻域的偏好上下文学习推荐算法,分别在三个经典推荐模型的基础上同时引入用户和物品的邻域信息,使新构建的模型效果得到提升。其次,对面向用户隐式反馈数据建模问题的推荐算法进行改进,以分解物品相似度模型为基础,提出基于用户近邻增强的矩阵分解模型和基于物品近邻增强的矩阵分解模型,两个新模型是将用户或物品的近邻信息作为辅助信息添加到原有的分解物品相似度的模型上,均获得了更好的实验结果。最后,本文以一个阿里巴巴集团天池大数据竞赛为内容背景,在完成属于推荐系统的子任务时,即口碑商家客流量预测,提出了采用特征工程技术的解决方案,求解了用户消费行为数据建模问题,该方案亦可为后续改进面向用户行为数据建模的推荐算法提供思路。