基于改进TextRank的藏文抽取式摘要生成
An Improved TextRank for Tibetan Summarization作者机构:中央民族大学信息工程学院北京100081 中央民族大学国家语言资源监测与研究中心少数民族语言分中心北京100081
出 版 物:《中文信息学报》 (Journal of Chinese Information Processing)
年 卷 期:2020年第34卷第9期
页 面:36-43页
核心收录:
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:目前,藏文抽取式文本摘要方法主要是提取文本自身的特征,对句子进行打分,不能挖掘句子中深层的语义信息。该文提出了一种改进的藏文抽取式摘要生成方法。该方法将外部语料库的信息以词向量的形式融入到TextRank算法,通过TextRank与词向量的结合,把句子中每个词语映射到高维词库形成句向量,进行迭代为句子打分,并选取分值最高的句子重新排序作为文本的摘要。实验结果表明,该方法能有效提升摘要质量。该文还在传统ROUGE评测方法的基础上,提出了一种采用句子语义相似度计算的方式进行摘要评测的方法。