基于异构图和关键词的抽取式文本摘要模型
Extractive Document Summarization Model Based on Heterogeneous Graph and Keywords作者机构:南京理工大学计算机科学与工程学院南京210094 国防科技大学信息系统工程重点实验室长沙410003 中国电子科技集团公司第二十八研究所南京210007
出 版 物:《电子科技大学学报》 (Journal of University of Electronic Science and Technology of China)
年 卷 期:2024年第53卷第2期
页 面:259-270页
核心收录:
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金(61872186) 国防基础科研计划国防科技重点实验室稳定支持项目(WDZC20225250405)
主 题:抽取式文本摘要 异构图 关键词 图注意力网络 多任务学习
摘 要:抽取式文本摘要使用一定的策略从冗长的文本中选择一些句子组成摘要,其关键在于要尽可能多地利用文本的语义信息和结构信息。为了更好地挖掘这些信息,进而利用它们指导摘要的抽取,提出了一种基于异构图和关键词的抽取式文本摘要模型(HGKSum)。该模型首先将文本建模为由句子节点和词语节点构成的异构图,在异构图上使用图注意力网络学习节点的特征,之后将关键词抽取任务作为文本摘要任务的辅助任务,使用多任务学习的方式进行训练,得到候选摘要,最后对候选摘要进行精炼以降低冗余度,得到最终摘要。在基准数据集上的对比实验表明,该模型性能优于基准模型,此外,消融实验也证明了引入异构节点和关键词的必要性。