咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于词嵌入的科研主题排序研究 收藏

基于词嵌入的科研主题排序研究

Automatic Scientific Topic Ranking based on Pre⁃trained Neural Embedding

作     者:何东彬 陶莎 任延昭 朱艳红 HE Dongbin;TAO Sha;REN Yanzhao;ZHU Yanhong

作者机构:石家庄学院未来信息技术学院石家庄050035 中国农业大学农业农村部农业信息化标准化重点实验室北京100083 北京工商大学计算机与信息工程学院北京100048 石家庄邮电职业技术学院计算机系石家庄050021 

出 版 物:《北方工业大学学报》 (Journal of North China University of Technology)

年 卷 期:2024年第36卷第1期

页      面:136-149页

学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:河北省重点研发计划项目(22320301D) 河北省农业科技成果转化项目(V1672275144902) 北京市科技计划课题项目(221100007122003) 石家庄学院博士科研启动基金项目(23BS018) 

主  题:主题模型 潜在狄利克雷分配(LDA) 主题排序 科研主题 词嵌入 

摘      要:为准确把握科研领域内文献主题的发展变化,常利用隐式语义特征提取科研主题分布。但由于主题挖掘技术本身的限制,并非所有主题都具有同等重要性或意义。有些主题可能包含太多背景词,信息空泛,或者主题词之间缺乏连贯性,导致主题缺乏实际意义。针对上述问题,在已有研究基础上,基于词嵌入,提出一种新的多维度评估主题质量算法;针对科研文档的特点,利用语料库的统计特征对无意义主题距离评估方法进行优化,并最终将二者融合到一个统一的主题排序框架中。实验结果表明,本文提出的方法可以有效提高主题排序整体效果,能够识别出非重要和质量差的主题,主题排序的整体效果优于现有方法。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分