基于隐式反馈的推荐方法及其应用研究
作者单位:山东师范大学
学位级别:硕士
导师姓名:丁艳辉
授予年度:2018年
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:近年来,随着互联网的快速发展,Web页面信息呈几何级数增长,已逐步发展成为信息海洋,导致信息过载现象严重。个性化推荐作为信息过滤的重要手段,是解决当前信息过载问题的一种很有效的方法。用户兴趣模型是个性化推荐系统的核心,一个良好的兴趣模型能够更好地提升推荐系统的性能,改善用户的上网体验和信息利用效率。因此,对于兴趣模型的研究具有重要的理论价值和现实意义。目前,国内外学者针对兴趣建模及其更新问题进行了大量的相关研究工作,并取得了丰硕的研究成果。但是,在用户兴趣建模及其更新的研究中,仍存在以下问题需要解决:第一,在建立用户兴趣模型时,往往只关注于用户浏览内容或用户浏览时的相关动作,缺少将二者相结合作为兴趣向量的考虑;第二,建立用户兴趣模型后,现有模型更新方法通常以时间遗忘曲线计算用户兴趣,不能及时根据用户自身兴趣偏移进行更新。本文以建立高效的兴趣模型作为研究目标,主要围绕着用户兴趣度度量和兴趣模型的表示更新两方面展开研究工作,并建立具有实际应用价值的推荐原型系统。本文的贡献和创新点主要包括以下几个方面:(1)针对现有用户兴趣模型缺少对用户浏览内容以及用户浏览时相关动作的有效融合,提出一种基于隐式反馈的用户兴趣模型构建方法,提高推荐的准确率。本文提出一种基于隐式反馈的用户兴趣模型构建方法,以解决现有用户兴趣模型缺少对用户浏览内容以及用户浏览时相关动作的有效融合的不足。该方法首先从用户浏览行为方面分析用户兴趣度,建立用户在页面浏览时间、浏览速度、保存页面与收藏页面等经典隐式反馈行为与兴趣度之间的联系;然后,基于隐式反馈行为,提出主题兴趣度的概念,并将其与传统的基于VSM的兴趣模型相结合,构建基于主题兴趣度的用户兴趣。通过在专业软件采集的数据集上与传统VSM模型方法进行对比,实验结果表明本文方法明显提高了模型推荐的准确率。(2)针对现有用户兴趣模型不能及时根据用户自身兴趣偏移进行更新的问题,提出了一种基于用户兴趣更新模型的隐式反馈推荐方法,提高了模型推荐准确率。本文提出一种基于用户兴趣更新模型的隐式反馈推荐方法,以解决现有用户兴趣模型不能及时根据用户自身兴趣偏移进行更新的不足。该方法首先将用户浏览的每一个网页的内容和由混合兴趣度度量方法计算出的网页兴趣度转化为一个向量;然后,对向量聚合运算后更新兴趣模型。在专业软件采集数据集上与基于K-means聚类模型的推荐方法进行对比,实验结果表明,本文模型提高了推荐准确率。(3)基于以上的研究成果,设计并实现了基于用户兴趣模型的推荐原型系统,为用户提供个性化推荐服务。