文本分类C#实现
A Text Categorization System with C#作者机构:暨南大学华文学院海外华语研究中心广州510610
出 版 物:《现代图书情报技术》 (New Technology of Library and Information Service)
年 卷 期:2007年第3期
页 面:43-45页
学科分类:08[工学] 0835[工学-软件工程] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:教育部"国家语言资源监测"项目(项目编号:L200401-01-04)的研究成果之一
摘 要:设计并实现一个基于向量空间模型和简单贝叶斯的文本分类系统,系统采用层级多标签的分类策略。详细介绍词语切分统计、终分类器值计算、层级小类校正和兼类判断四个子系统模块。基于向量空间模型分类的第一级大类和层级小类的微平均分别为89.7%和77.8%,简单贝叶斯分别为67.6%和66.5%。