融合版本语义相似度的贡献者信誉评价模型研究
作者单位:湖南科技大学
学位级别:硕士
导师姓名:赵肄江
授予年度:2023年
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:贡献者信誉 语义相似度 本体 改进WPCA 开放街道图
摘 要:本文提出了一个融合版本语义相似度的贡献者信誉评价模型,旨在解决Open Street Map(OSM)贡献者信誉评价过程中目标版本间语义相似度未有效度量导致的评价不准确的问题。由于VGI贡献者的非专业性,其信誉对数据质量有着重要的影响,因此准确评价贡献者信誉具有实际意义。本研究所提出的模型通过降维和分类方法得到初始信誉,进而利用概念本体计算目标版本的语义相似度,并将目标版本的语义相似度、几何相似度和拓扑关系相似度与初始信誉综合计算得到贡献者信誉。最终采用实际数据验证了本模型的有效性。该模型可为VGI领域的贡献者信誉评价提供参考,为提高数据质量提供支持。具体的内容与学术贡献包括: 1)借鉴知识领域的本体相关研究,以此为基础构建志愿者地理信息本体。其中,组织实体类型明确了各实体类型间的关系,并将实体类型组织到地理信息本体的体系结构中。描述实体类型通过本体概念框架具体描述了志愿者地理信息实体的定义、语义关系、性质和属性等。此外,本研究建立了评价志愿者贡献目标的语义相似度评价模型,采用概念属性相似度和概念树结构语义距离作为计算概念间语义相似度的指标。然后,结合目标版本间的本体概念语义相似度、几何相似度和拓扑关系计算用户评价信誉;2)提出用户初始信誉的评价方法,首先通过基于改进加权主成分分析方法(WPCA)的贡献者特征降维和贡献者分类方法将用户分类,然后通过Kealeboga Moreri等人的研究成果:OSM中可靠的数据集主要由四分之三的贡献者提供,75%的贡献者会为数据集提供高质量数据。因此,按照比例将新手和不熟练的贡献者初始信誉值确定为0.75,主要贡献者初始信誉值确定为0.9,专业贡献者初始信誉值确定为1,并通过实验验证了该方法的有效性;3)提出用户信誉的综合评价方法,贡献者信誉由贡献者初始信誉和评价信誉聚合组成。随着贡献者提供数据的增加,贡献者获得的评价越来越多,此时初始信誉对贡献者信誉的影响变小,评价信誉可以近似于贡献者信誉贡献者。因此,信誉组成逐渐从以初始信誉为主,评价信誉为辅转变为以评价信誉为主,初始信誉为辅,较好地结合了初始信誉和评价信誉;4)采用OSM的真实历史贡献数据实验验证了本文提出的用户信誉模型的有效性。实验表明,贡献者信誉与贡献者初始信誉基本呈正相关关系和数据质量与贡献者的信誉值总体呈正相关关系。因为考虑了目标版本间的语义相似度,因此能更加准确地评价贡献者的标报数据。