基于LDA和关系图谱的数据治理文献主题演化研究
作者机构:贵州财经大学信息学院贵州贵阳550025 涟水县财政局江苏淮安223400 贵州高速公路集团有限公司贵州贵阳550027
出 版 物:《信息技术与信息化》 (Information Technology and Informatization)
年 卷 期:2022年第8期
页 面:6-12页
学科分类:1205[管理学-图书情报与档案管理] 12[管理学] 081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 120502[管理学-情报学] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:贵州省科技计划项目(No.黔科合基础1041,No.黔科合基础1Y279) 贵州省教育厅青年科技人才成长项目(No.黔教合KY字135) 贵州财经大学2021年度校级项目(No.2021KYQN03)
摘 要:针对数据治理领域缺乏深层次的主题挖掘,未有效结合机器学习算法开展主题演化研究,无法精准感知数据治理的变化趋势及主题演化规律问题,提出了一种基于LDA模型和关系图谱的数据治理文献主题演化算法。首先,利用LDA模型和层次聚类算法梳理数据治理的核心主题;其次,结合文本特征和群体特征开展主题关系图谱及科研群体发现研究;最后,通过计算主题消融权重实现数据治理主题演化感知分析。实验结果表明,文章提出的方法能有效挖掘数据治理文献的主题,梳理该领域知识的发展态势,确定未来的研究趋势和热点,为数据治理领域的发展提供了理论基础和研究思路。