融合评论文本方面信息的深度学习推荐算法研究
作者单位:国防科技大学
学位级别:硕士
导师姓名:吕欣;谭索怡
授予年度:2022年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 081203[工学-计算机应用技术] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:推荐算法 方面级情感分析 评论文本挖掘 神经网络 评分预测
摘 要:随着信息技术的迅速发展,互联网已普及至娱乐、消费、工作、学习等诸多领域,影响着社会生活与发展的方方面面。在多样化的互联网应用程序、近乎无限的网络连通性以及快速发展的信息共享机制的驱动下,互联网用户规模快速膨胀,网络信息传播渠道急剧增加,且这一趋势仍在进一步扩张。尽管互联网信息的大量涌入被认为是推动多个应用领域快速发展的重要因素,但其也使得信息的获取成本不断攀升,进而导致了信息过载问题。推荐算法基于用户历史行为建模用户兴趣,并以用户兴趣为核心自动过滤网络中的海量信息,能够帮助用户筛选合适的内容或商品,优化用户的使用体验,为缓解信息过载问题提供了高效的解决方案。传统的推荐算法主要基于用户/项目的属性特征以及评分构建,但用户/项目属性特征多为静态基本特征,无法体现用户在不同场景下的动态偏好。近年来在线平台的迅猛发展以及用户对于各类产品体验的积极分享,促使用户评论信息总量不断增长,越来越多的研究开始关注蕴含丰富用户-项目交互信息的评论文本。当前基于评论信息的诸多推荐算法中,多数方法的建模维度均停留在文档级/评论级层面,而没有考虑评论中所蕴含的细粒度的方面级信息。事实上,方面级信息作为用户评论中关于项目属性的描述以及评价,如商品价格及用户对于价格的评价描述,有助于进一步揭示整体评分背后潜在的更细致的用户感受以及更深层的用户体验,对于推荐算法的建模过程具有不可替代的重要性。尽管目前部分研究工作已尝试将方面级信息融入到推荐算法的建模过程中,但大部分方法仅基于方面级信息进行推荐算法建模,有关考虑方面特征、评论特征、ID特征等多源信息进行联合建模的研究工作还少见报道,且模型的结构及性能仍有进一步优化提高的空间。此外,多数融合方面级信息的推荐模型需要特定领域的方面级信息作为先验知识,这也使得模型的普适性受到了一定程度的限制。针对以上问题,本文主要开展了以下四个方面的工作:(1)对比了方面级情感分析方法在实际任务场景下的推荐性能以基于情感词典的以及基于位置感知标记的两种主流方面级情感分析方法为基础,分别构建了融合方面级信息的基础推荐模型Neural CF和Neural CF,验证了方面级信息对于推荐算法建模过程的有效性,对两种方面级情感分析方法的应用效果以及任务适应性进行了对比分析,并选定基于情感词典的方面级情感分析方法作为最终的方面级信息提取模型。(2)提出了基于多维特征融合的深度学习推荐模型ABRLR融合评论/方面/ID特征等多源信息,构建了基于多维特征融合的ABRLR模型,通过对比基于情感词典的以及基于位置感知标记的两种方面级情感分析方法在ABRLR模型框架下的应用效果,进一步验证了基于情感词典的方面级情感分析方法的有效性。同时,基于亚马逊公开评论数据集对比了ABRLR模型与四种主流推荐模型的预测性能,实验结果表明与最优基准方案相比,融合多源信息的ABRLR模型显著提高了推荐模型的预测性能,其MSE指标在三个数据集上最高降低了4.64%。(3)优化了基于多维特征融合的ABRLR模型的框架结构在融合方面级信息的推荐模型的建模过程中,对比了不同的评论/方面/ID特征等多源信息的融合方式、用户-项目特征交互方式以及用户-项目交互特征处理方式对推荐模型建模效果的影响,并综合各类方案的性能表现对ABRLR模型框架中的多源信息融合方式以及用户-项目交互特征处理方式进行了优化,从而进一步提升了ABRLR模型的建模效果。(4)提出了基于注意力机制的ABNAR深度推荐优化模型综合评论特征以及方面特征构建了评论/方面双层注意力网络,并提出了联合建模用户/项目向量的用户-项目特征联合学习层,从而进一步建模评论文本的信息性以及用户向量与项目向量间的相互影响。进一步地,以优化后的ABRLR模型框架结构为基础,通过引入评论/方面双层注意力网络以及用户-项目联合学习层提出ABNAR模型,实现了对用户/项目向量的更充分的学习,取得了较ABRLR模型更优的预测性能,在三个数据集上其MSE指标与ABRLR模型相比最高降低了2.30%。