基于wordNet的类别可拓展网页分类系统(英文)
WordNet based webpage classification system with category expansion作者机构:深圳大学计算机与软件学院深圳518060
出 版 物:《深圳大学学报(理工版)》 (Journal of Shenzhen University(Science and Engineering))
年 卷 期:2009年第26卷第2期
页 面:116-120页
核心收录:
学科分类:08[工学] 0835[工学-软件工程] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金资助项目(60673122) 深圳市科技基金资助项目(200740)
主 题:信息提取 网页分类 wordNet 基于词义分类 类别拓展
摘 要:基于文本写作常采用一个意思由多个不同写法的单词来表述,研究词义文本分类法被用来替代使用关键词分类算法以提高分类准确率.分析wordNet内Synset架构,认为一个兼顾词义以及词义间关系的词义文本分类系统可应用到网页分类中.该系统同时注意到固定的文本类别结构以及结构内不断增长的文件数目间的区别,加入了基于类别信息聚类方法的类别拓展的功能.仿真实验证明,该分类系统与现有的基于语义的分类系统相比,在分类准确度性能上能提高13%.基于类别信息类聚的文本拓展功能与采用基于相似度的类聚方法的系统相比获得了一个质量更高的新增类别.