咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于模糊粗糙集的Web文本分类 收藏

基于模糊粗糙集的Web文本分类

Web Document Classification Based on Fuzzy-Rough Set

作     者:孙海虹 丁华福 SUN Hai-hong;DING Hua-fu

作者机构:哈尔滨理工大学计算机科学与技术系黑龙江哈尔滨150080 

出 版 物:《计算机技术与发展》 (Computer Technology and Development)

年 卷 期:2010年第20卷第7期

页      面:21-24页

学科分类:08[工学] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家自然科学基金重点项目(60736014) 

主  题:机器学习 模糊粗糙集 Web文本分类 属性约简 

摘      要:网络信息的多样性和多变性给信息的管理和过滤带来极大困难,为加快网络信息的分类速度和分类精度,提出了一种基于模糊粗糙集的Web文本分类方法。采用机器学习的方法:在训练阶段,首先对Web文本信息预处理,用向量空间模型表示文本,生成初始特征属性空间,并进行权值计算;然后用模糊粗糙集算法来进行信息过滤,用基于模糊粗糙集的属性约简算法生成分类规则;最后利用知识库进行文档分类。在测试阶段,对未经预处理的文本直接进行关键属性匹配,经模糊粗糙因子加权后,用空间距离法分类。通过试验比较,该方法具有较好的分类效果。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分