文本主要信息的自动获取和主体挖掘
Main text information auto-acquisition and subject mining作者机构:玉林师范学院计算机科学与工程学院广西玉林537000
出 版 物:《信息技术与信息化》 (Information Technology and Informatization)
年 卷 期:2017年第3期
页 面:41-43页
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:2015年国家级大学生创新创业训练计划项目(201510606058) 广西高等教育本科教学改革工程项目(2016JGB342)
摘 要:文本挖掘是数据挖掘的重要内容之一,其应用十分广泛。对文本文件进行分析的一个前提条件是对文本文件进行分词处理,中文分词是进行中文信息处理的一个难点。为此,本文采用了分词算法^([1])和支持向量机^([2])对文本进行分类,设计和实现文本文件主要信息自动获取系统。。