基于文本挖掘的多准则推荐系统
作者单位:天津大学
学位级别:硕士
导师姓名:郭均鹏
授予年度:2017年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:随着互联网的不断发展和普及,可用的信息量急剧增加,从而导致了信息过载等问题。为了解决这一问题,能够根据用户历史评分数据自动为用户进行推荐的个性化推荐系统应运而生。然而,在真实的电子商务环境中,由于很难获得足够的评分信息,从而极易引起数据稀疏的问题。因此,为了解决这个问题,其他丰富的用户评价内容也逐渐被应用于用户建模和生成推荐的过程中。本文提出了两种基于文本评论的推荐方法,即直接利用评论进行推荐和将评论转化为评分的方法。其中,将评论转化为评分的推荐算法FSRI从用户评论中提取情感强度代替数值评分,对传统的基于记忆的协同过滤推荐进行了完善和扩展。另一种方法,直接利用评论进行推荐的算法FSCD则直接利用用户评论中的文本内容构建用户和项目模型。两种方法都用到了本文提出的模糊情感强度的计算方法,该方法基于知网的情感词典,为不同的词语赋予了不同的情感强度。不仅如此,文本重点关注用户的多准则偏好,本文为在线评论分类提出了一个半监督式的框架,使用信息增益(IG)来进行特征选择和支持向量机(SVM),以确定每一个句子属于哪个类别的准则。此外,我们还将用户之间或用户和项目之间的相似性扩展到了多准则推荐领域。相比现有的基于评论的推荐算法,本文提出的方法有两个主要的优势。首先,我们强调了从用户评论中挖掘出的多准则偏好,更加准确的完善构建了用户模型,描述了用户的偏好。其次,我们利用了模糊逻辑方法来解决自然语言描述中的不准确、含糊等问题。实验结果表明,本文提出的两种方法在推荐结果的各个方面均有良好表现,并且在大多数情况下,直接利用评论信息进行推荐的算法要优于将评论转化为评分的推荐算法。