咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于领域概念图的航天新闻自动摘要模型 收藏

基于领域概念图的航天新闻自动摘要模型

Automatic summarization model of aerospace news based on domain concept graph

作     者:黄浩宁 陈志敏 徐聪 张晓燕 HUANG Haoning;CHEN Zhimin;XU Cong;ZHANG Xiaoyan

作者机构:中国科学院国家空间科学中心北京100190 中国科学院大学北京100049 国家无线电监测中心北京100037 

出 版 物:《北京航空航天大学学报》 (Journal of Beijing University of Aeronautics and Astronautics)

年 卷 期:2024年第50卷第1期

页      面:317-327页

核心收录:

学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家自然科学基金(91738101) 国家重点研发计划(2020YFB1807900) 

主  题:自动文本摘要 领域概念图 预训练语言模型 图排序算法 图节点聚类 

摘      要:互联网海量的航天新闻中隐含着大量航天情报信息,对其进行理解与压缩是提高后续情报分析效率的基础。然而通用的自动摘要算法往往会忽略很多航天领域关键信息,且有监督自动摘要算法需要对领域文本进行大量的数据标注,费时费力。因此,提出一种基于领域概念图的无监督自动摘要(DCG-TextRank)模型,利用领域术语辅助引导图排序,提高模型对领域文本的理解力。该模型分3个模块:领域概念图生成、图权重初始化、图排序及语义筛选。根据句向量相似度和领域术语库,将文本转换为包含句子节点和领域术语节点的领域概念图;根据航天新闻文本特征初始化领域概念图权值;采用TextRank模型对句子进行排序,并在语义筛选模块通过图节点聚类及设置摘要语义保留度的方法改进TextRank的输出,充分保留文本的多语义信息并降低冗余。所提模型具有领域可移植性,且实验结果表明:在航天新闻数据集中,所提模型相比传统TextRank模型性能提升了14.97%,相比有监督抽取式文本摘要模型BertSum和MatchSum性能提升了4.37%~12.97%。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分