基于协同过滤的个性化推荐算法
作者单位:河南理工大学
学位级别:硕士
导师姓名:王岩
授予年度:2020年
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:皮尔逊相似度 肯德尔相似度 集成学习 聚类算法 蜂群算法 个性化算法
摘 要:随着信息数量的增加,用户对数据的评分也越来越不准确,这就是数据稀疏引起的问题。如何高效的解决这一问题,成为当前推荐系统的研究热点,文中根据现有推荐系统中存在的数据稀疏性问题进行更深入的研究。为了使推荐算法的推荐效果得到质的提升,本文最大化地使用用户的各种信息,并构建出一种改进蜂群优化K-means(10)(10)聚类集成的联合相似度推荐算法。此算法的步骤为:首先,对蜂群算法作出相应的修改,并使用改进的算法对K-means(10)(10)算法的簇内中心位置进行处理并优化,使得簇内的中心不仅可以在某一范围内能够得到最佳的簇内中心,而且可以在文中使用到的所有数据范围内都是最佳的簇内中心;其次,对数据集使用改进的聚类算法进行集成;再次,针对传统的算法使用一种相似度算法引起的推荐效果不足的问题,文中使用两种不同的相似度算法进行线性结合构成一个新的相似度作为同簇内不同用户的相似度计算;最后,从相似用户的信息中筛选出分值大于此用户平均评分的信息,并按照评分从高到低生成推荐列表传递给目标用户供其选择。该种算法通过实验证明,它不仅能够缓解数据稀疏而且提高推荐的质量和准确性。本文的创新之处主要有以下几个方面:(1)对于经典推荐算法中数据集中存在的数据稀疏现象,文中使用聚类算法对其做深入的修改,通过引入人工蜂群算法和集成学习算法优化聚类算法,为验证文中改进的聚类算法的性能使用几种不同的数据集,如Iris、Red Wine、Movielens100K等分别进行验证,经验证文中算法比其他对比算法达到的效果更好。(2)针对传统推荐算法的相似度比较单一的问题,文中使用两个不同的相似度互相结合,分别对同一类中用户之间的信息和用户评分之间的信息使用不同的相似度算法进行计算,从而构成一个新的相似度,使用户的信息得到最大价值的使用,并将该思想用算法成功实现。