基于异构图分层学习的细粒度多文档摘要抽取
Fine-Grained Multi-Document Summarization Extraction Based on Heterogeneous Graph Hierarchical Learning作者机构:广东工业大学计算机学院广东广州510006
出 版 物:《计算机工程》 (Computer Engineering)
年 卷 期:2024年第50卷第3期
页 面:336-344页
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:科技创新2030—“新一代人工智能”重大项目(2021ZD0111501) 国家优秀青年科学基金(62122022) 国家自然科学基金(61876043,61976052,62206064)
主 题:抽取式多文档摘要 细粒度建模 异构图 分层学习 语义关系 结构关系
摘 要:抽取的目标是在多个文档中提取共有关键信息,其对简洁性的要求高于单文档摘要抽取。现有的多文档摘要抽取方法通常在句子级别进行建模,容易引入较多的冗余信息。为了解决上述问题,提出一种基于异构图分层学习的多文档摘要抽取框架,通过层次化构建单词层级图和子句层级图来有效建模语义关系和结构关系。针对单词层级图和子句层级图这2个异构图的学习问题,设计具有不同层次更新机制的两层学习层来降低学习多种结构关系的难度。在单词层级图学习层,提出交替更新机制更新不同的粒度节点,以单词节点为载体通过图注意网络进行语义信息传递;在子句层级图学习层,提出两阶段分步学习更新机制聚合多种结构关系,第一阶段聚合同构关系,第二阶段基于注意力聚合异构关系。实验结果表明,与抽取式基准模型相比,该框架在Multinews数据集上取得了显著的性能提升,ROUGE-1、ROUGE-2和ROUGE-L分别提高0.88、0.23和2.27,消融实验结果也验证了两层学习层及其层次更新机制的有效性。