融合辅助信息的跨领域推荐算法的研究与实现
作者单位:重庆邮电大学
学位级别:硕士
导师姓名:黄梅根
授予年度:2022年
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:跨域推荐 数据稀疏性 冷启动用户 辅助信息 深度学习
摘 要:随着移动互联网的普及,网络上的信息数据不断增加,用户面临着信息过载问题,推荐系统就是在这种背景下产生的。推荐系统从大量动态生成的信息中过滤出重要的信息数据,深入发掘出用户的兴趣偏好。但在实际应用中,推荐系统的性能受制于评分数据的稀疏和用户的冷启动等各方面的问题。跨域推荐可以利用用户在其他领域内的交互数据来丰富当前领域的稀疏数据,再加上互联网应用中,用户画像和产品属性信息的丰富及多元化,推荐系统可以融合这些辅助信息并利用跨域推荐来解决上述问题。此外,深度学习技术可以结合多源异构数据,更好地提取用户和项目的特征。因此本文从使用深度学习技术提取融合辅助信息的特征向量,并利用跨域推荐来提高推荐性能等方面展开了研究,最后基于此基础,设计并实现了一个简单的针对电影和图书的推荐系统。本文的主要工作如下:1.针对单域中的评分数据稀疏性问题,提出了基于双降噪自动编码器的推荐算法(Recommendation Based on Dual Denoising Autoencoder,Re DD)。为了能够更好地将辅助信息和评分矩阵结合,本文扩展了一般的降噪自动编码器,使其拥有两个输入输出层,并在隐藏层学习到融合评分信息和辅助信息的低维特征向量;然后通过两个扩展的降噪自动编码器分别提取用户和项目的特征,并联合矩阵分解模型训练,更新优化模型参数,完成推荐。通过实验证明了该算法的有效性。2.针对现有跨域推荐算法的不足,本文在Re DD模型的基础上,设计出了一个融合辅助信息的跨域推荐算法(Cross-Domain Recommendation by Fusing Side Information,CDRSI)。本文通过Re DD模型在辅助域和目标域提取融合评分信息和辅助信息的特征向量;并根据不同域之间的评分稀疏比,生成用户基准因子;通过DNN神经网络映射目标域中用户特征,来拟合基准因子,完成跨域推荐。通过实验证明了该模型的有效性。3.应用上述算法设计并实现了一个简单的图书和电影的推荐系统。系统根据用户和项目的配置信息及用户的历史行为数据,为用户做出图书和电影的推荐。