基于超图的文本摘要与关键词协同抽取研究
A Hypergraph Based Approach to Collaborative Text Summarization and Keyword Extraction作者机构:华中师范大学计算机学院湖北武汉430079
出 版 物:《中文信息学报》 (Journal of Chinese Information Processing)
年 卷 期:2015年第29卷第6期
页 面:135-140页
核心收录:
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金青年科学基金(61402191) 华中师范大学中央高校基本科研业务费项目(CCNU14A05015 CCNU15ZD003) 华中师范大学教师科研启动基金项目 国家社科基金重大计划招标项目(12&2D223)
摘 要:文本摘要和关键词抽取是自然语言处理领域的两个重要研究课题,它们均以生成描述文本主旨内容的精简信息为目标。尽管这两个任务目标相似,但它们通常被作为两个独立的问题分别研究,而较少考虑其彼此间的自然关联性。尽管已有学者提出了基于图模型的协同抽取方法,该方法同时考虑了句子与句子、词与词、句子与词之间的各种关系,以迭代强化的方式同时生成文本摘要和关键词,但现有模型大多仅限于表达句子与词之间的各种二元关系,而忽视了不同文本单元间潜在的若干重要的高阶关系。鉴于此,该文提出了一种新的基于超图的协同抽取方法。该方法以句子作为超边,以词作为节点构建超图,在一个统一的超图模型下同时利用句子与词之间的高阶信息来生成摘要和关键词。在NLPCC 2015面向微博的新闻文本摘要任务数据集上的实验结果验证了所提方法的可行性和有效性。