多语义路径融合的个性化论文推荐研究与实现
作者单位:中南财经政法大学
学位级别:硕士
导师姓名:张承德
授予年度:2022年
学科分类:1205[管理学-图书情报与档案管理] 12[管理学] 081203[工学-计算机应用技术] 08[工学] 120502[管理学-情报学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:随着信息爆炸时代到来,越来越多的人难以在短时间内找到自己需要的资源。尤其是在蓬勃发展的科学研究领域,论文数量呈指数级增长,这给快速获取与自己研究领域密切相关的论文带了巨大的困难。通常,在研究生教育期间,为了更好的梳理自己研究方向的发展脉络,研究生要花费大量的时间和精力寻找论文。因此,个性化的论文推荐方法被研究生们所期待。近年来,随着社交网络的快速发展,基于社会关系规则和网络理论的推荐方法在一定程度上提高了推荐性能。然而,由于网络中节点类型的多样化和信息的深度融合,节点之间的潜在语义变得极其复杂。现有的论文推荐方法主要关注三、四个论文属性(比如标题、作者、出版物和关键词等),由这些属性信息构成的网络模式异常稀疏,易导致论文属性之间重要的语义路径丢失,进一步导致相关论文之间的关联缺失,影响论文的推荐效果。因此,在论文推荐过程中捕获多语义路径成为一个巨大的挑战。由于不同语义路径包含共同的同质和异质属性,可以通过这些共同属性找到多条语义路径之间的关系,从而建立起更多相关论文之间的关联。为了解决上述问题,本文提出一种新的异质网络中多语义路径融合的个性化论文推荐框架。在数据收集和预处理之后,通过丰富异质网络中的节点信息和边信息来构建一种新的异质教育网络(Heterogeneous Educational Network,HEN)模式,这个新的HEN模式中包含六个不同的节点类型,分别是论文标题、作者、出版物、关键词、基金和作者单位,还包含五种不同的直接相连的边信息和一种间接相连的边信息,分别是标题-作者、标题-出版物、标题-关键词、标题-基金、作者-作者单位以及标题-作者单位;其次,通过投影子网来生成不同语义的元路径,这些元路径由不同类型的节点构成,分别表示不同的语义信息;然后,一个新的多语义路径融合的HEN嵌入方法被提出,以产生丰富的HEN节点序列;最后,通过多语义路径的相似性为研究生个性化推荐论文。本文所提出框架方法的实验是在1987年至2021年教育促进代际流动研究领域和1997年至2021年数据挖掘与智能媒体研究领域两个论文数据集上进行的。大量实验表明,丰富异质信息网络和多语义路径融合有助于提高论文推荐的效率,即本文所提出的方法是有效的。基于本文提出的框架,通过需求分析和系统设计实现了一个个性化论文推荐系统。该系统包含检索论文、论文信息可视化、用户信息管理和论文信息管理等多个功能模块,可以为研究生提供个性化论文推荐服务,从而提高研究生的科研效率。