多源数据融合的新兴主题探测研究——以文化遗产领域为例
Research on Emerging Topic Detection of Multi-Source Data Fusion: Taking Cultural Heritage as an Example作者机构:上海大学文化遗产与信息管理学院上海200444
出 版 物:《图书情报工作》 (Library and Information Service)
年 卷 期:2023年第67卷第9期
页 面:23-31页
核心收录:
基 金:国家社会科学基金项目“基于多元数据融合的社科领域新兴主题探测方法及实证研究”(项目编号:21BTQ010)研究成果之一。
摘 要:[目的/意义]大科学时代,海量且类型多样的学术文献给新兴主题的识别和把握带来一定的困难和障碍。因此,基于多源数据,新兴主题探测方法的研究就十分必要和有意义。[方法/过程]对期刊论文、学位论文、会议文献、基金项目等多种来源数据,利用PLDA模型分别进行文本语义内容挖掘,结合VSM模型将多源数据在主题语义层面进行深度融合,并根据新兴主题特征量化指标进行筛选和识别。[结果/结论]实证研究表明将文本内容挖掘和文献计量测度相结合进行文化遗产领域新兴主题探测方法可行;同时分析该领域新兴主题的数据源分布情况,发现其最初多以会议文献和基金项目形式呈现,期刊论文、学位论文具有一定滞后性。