基于标签的旅游景点个性化推荐研究——以青岛市为例
作者单位:山东科技大学
学位级别:硕士
导师姓名:刘文宝;牟乃夏;王海银
授予年度:2018年
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:标签 自然语言处理 旅游景点 基于标签的推荐 青岛市
摘 要:面对爆炸式增长的旅游信息和多样化的旅游需求,旅游者需要考虑诸如爱好、时间、价格、位置等因素,才能从海量的旅游信息中找到适合的旅游景点,搜寻查找的过程会消耗相当多的精力和时间,也会降低用户的旅行体验。为了解决这种问题,旅游景点的个性化推荐应运而生,进行准确、高效的旅游景点个性化推荐研究具有良好的实用价值。传统的个性化推荐算法通常以用户评分或历史旅游景点来表示兴趣偏好和用户相似度,忽略了用户在不同时间的需求以及景点自身的特征,而且相似度计算精度较低,对新景点的推荐效果不好。虽然标签在一定程度上可以用来表示景点自身的特征,但是用户偏向于依据个人的喜好自由标注资源,从而导致标注的标签覆盖面小、随意性大,过于片面,而且旅游网站上关于景点的标签较少,缺乏统一的分类标准。针对上述问题,本文做了以下工作:(1)丰富标签。本文首先综合旅游目的地的形象感知点及感知形象划分准则,制定符合本文需求的景点特征词表,并考虑青岛的特色以及携程网公布的景点类型标签数据,补充完善特征词表,作为规范的景点标签分类标准;然后从景点评论中提取符合景点特征的关键词,并将其归类到相应的景点特征标签中;最后使用网站提供的景点类型标签来丰富提取的标签,考虑了景点自身的特征。(2)改进相似度的计算。本文提出用景点特征标签来代替景点本身,以用户偏好景点的特征标签来描述用户的兴趣偏好,并求解用户之间的相似度,在一定程度上缓解用户冷启动问题,并能有效地区分同类型的景点。而且在求解目标用户的相似邻居用户时,使用基于相似度门槛来求解(Threshold neighborhoods),有效地避免了将相似性不高的用户作为邻居用户的情况,提高了相似邻居用户的求解精度。(3)改进了基于标签的旅游景点个性化推荐算法。首先将景点活动、游玩对象、游玩时间、景点门票、文化风俗、娱乐设施、购物、美食小吃等8个因素下相关的标签结合起来,丰富了能表征景点特征、用户兴趣偏好的标签;然后将其与传统的推荐技术结合起来,分别对基于标签的推荐算法和基于标签的协同过滤算法的推荐结果进行分析;最后分别对这两种算法的推荐结果赋予相应的权重,进行简单加和,有效融合了两种推荐算法的优势,对基于标签的混合推荐算法的推荐结果进行分析,推荐的准确率和召回率有所提高,推荐效果良好,增强了用户的旅行体验。