基于主题约束的篇章级文本生成方法
Discourse-Level Text Generation Method Based on Topical Constraint作者机构:华中科技大学计算机科学与技术学院武汉430074 深圳华中科技大学研究院深圳518063 中南民族大学计算机科学学院武汉430074
出 版 物:《北京大学学报(自然科学版)》 (Acta Scientiarum Naturalium Universitatis Pekinensis)
年 卷 期:2020年第56卷第1期
页 面:9-15页
核心收录:
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:深圳市科技计划基础研究项目(JCYJ20180306124612893 JCYJ20170818160208570 JCYJ20170307160458368)资助
主 题:文本自动生成 主题约束 循环神经网络(RNN) 长短时记忆网络(LSTM) 注意力机制
摘 要:针对计算机自动生成的文本缺乏主题思想这一问题,提出一种基于主题约束的篇章级文本自动生成方法。该方法围绕用户输入的主题描述语句提取若干主题词;然后对主题词进行扩展和主题聚类,形成文章主题规划;最后利用每个聚类中的关键词信息约束每个段落的文本生成。该模型从文本主题分布、注意力评分方法和主题覆盖生成3个方面对现有基于注意力机制的循环神经网络文本生成模型进行了改进。在3个真实数据集上分别与Char-RNN,SC-LSTM和MTA-LSTM基准模型进行对比,并对3个方面的改进进行独立验证。实验结果表明,所提方法在人工评判和BLEU自动评测上均优于基准模型,生成的文本能更好地贴合主题。