基于文本聚类的多文档自动文摘研究
Research on Multi-Document Automatic Abstracting Based on Text Clustering作者机构:华北电力大学计算机科学与技术学院北京102206 华北电力大学计算机科学与技术学院北京102206 北京信息科技大学人文社科学院北京100101 华北电力大学计算机科学与技术学院北京102206
出 版 物:《计算机研究与发展》 (Journal of Computer Research and Development)
年 卷 期:2007年第44卷第Z2期
页 面:140-144页
核心收录:
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家"八六三"高技术研究发展计划基金项目(2004AA1Z2450) 国家自然科学基金项目(70572090,60305009) 华北电力大学博士学位教师科研基金项目(H0585)
摘 要:针对当前自动文摘方法的不足,提出了基于文本聚类的自动文摘实现方法.可以克服常规自动文摘方法的不足,使文摘的质量和效果得到大大的提高.将文本聚类引入自动文摘中,不但使单文档的文摘质量得到提高,而且能够实现多文档的自动文摘,这是现有的自动文摘技术所没有涉及的.实现了面向塑料行业的基于文本聚类的自动文摘系统TCAAS.实验表明该方法可行, 对自动文摘系统的设计具有借鉴意义和深入研究的价值.