基于评论的双视角深度推荐模型研究
作者单位:安徽大学
学位级别:硕士
导师姓名:刘慧婷
授予年度:2022年
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:推荐系统 跨领域推荐 矩阵分解 深度学习 双视角学习
摘 要:在各种推荐系统中,用户对项目的数值评分和文字评论是反馈其偏好的主要信息。然而,传统的仅借助用户的评分来进行推荐的模型,如协同过滤,在数据非常稀疏的场景下无法有效工作。当前的一些仅使用评论信息进行推荐的模型也会受到评论稀疏性的影响。一方面,大多数场景下用户给出评分和评论都是相互关联和互补的,评论可以解释为什么用户对这个项目给予高或低的评分。另一方面,评分和评论分别从粗粒度和细粒度两个层面反映了用户的偏好,即用户可能会对项目的某些方面做出正面的评论,即使他对该项目的整体评分很低。由于评分和评论存在上述差异性,它们有属于自己特定视角的信息。因此,通过有效地整合来自不同视角,即共享视角和特定视角的评分和文本评论信息,可以更准确地预测用户对项目偏好。此外,跨领域的推荐也存在类似特点。相同用户在不同领域购买的商品具备一定共享的特征,例如它们是相同的类型,此时两个领域之间的购买信息是相互关联和互补的。但也存在领域特定的特征,不同领域的商品都有它们独特的特征。因此,通过有效地整合领域共享和领域特定的表示,可以进行更有效的跨领域推荐。针对以上问题,本文提出了两种基于评论的双视角信息抽取推荐模型。第一种是基于共享视角和特定视角信息抽取推荐模型(SSIR)。该模型有两个关键组件,包括共享视角信息提取和特定视角信息抽取模块。从共享视角的角度来看,SSIR整合了对抗混淆损失和评分预测损失,从评论和评分中提取可共享的信息。在特定视角部分,SSIR对上述共享视角的信息和特定视角抽取得到信息应用正交约束,从而从评分和评论中提取其特定的特征。之后本文融合了从这两个视角中提取的特征来进行最终的评分预测任务。此外,本文还使用了辅助评论来应对评论的稀疏性问题。为了证明本文的方法能够适应评论和评分较少的推荐场景,本文使用了8个数据集的数据分别进行了实验。实验结果验证了SSIR的有效性和鲁棒性。第二种是基于评论的跨领域双视角推荐模型(DIDR),该模型有两个关键组件,包括领域共享信息提取和领域特定信息抽取模块。从领域共享的角度来看,DIDR整合了对抗混淆损失和跨领域注意力机制,学习不同领域间的共享特征。在领域特定视角部分,DIDR对上述领域共享的信息特征和领域特定抽取得到信息应用正交约束,从而在不同领域内提取其特定的特征。之后模型融合了从这两个模块中提取的特征来进行最终的评分预测任务。最后,本文使用了2个不同的跨领域数据集数据进行了实验,证实了DIDR模型可以在跨领域应用场景取得更好的模型性能。