基于LDA-BERT相似性测度模型的文本主题演化研究
Topic Evolution Research Based on LDA-BERT Similarity Measure Model作者机构:华东理工大学科技信息研究所
出 版 物:《图书馆工作与研究》 (Library Work and Study)
年 卷 期:2024年第1期
页 面:72-79页
学科分类:1205[管理学-图书情报与档案管理] 12[管理学] 120502[管理学-情报学]
主 题:相似性测度 LDA-BERT模型 LDA模型 BERT模型 主题演化
摘 要:文章针对LDA主题模型在提取文本主题时忽略文本语义关联的问题,提出基于LDA-BERT的相似性测度模型:首先,结合利用TF-IDF和TextRank方法提取文本特征词,利用LDA主题模型挖掘文本主题;其次,通过嵌入BERT模型,结合LDA主题模型构建的主题-主题词概率分布,从词粒度层面表示主题向量;最后,利用余弦相似度算法计算主题之间的相似度。在相似性测度模型基础上构建向量相似度指标分析文献研究主题之间的关联,并绘制主题演化知识图谱。通过智慧图书馆领域的实证研究发现,使用LDA-BERT模型计算出的主题相似度结果相较于LDA主题模型的计算结果更加准确,与实际情况更相符。