一种基于多模态模型的随机子空间分类集成算法
A Multi-modality-based Random Subspace Classifier Ensemble Algorithm作者机构:南京师范大学计算机科学与技术学院江苏南京210097
出 版 物:《南京师范大学学报(工程技术版)》 (Journal of Nanjing Normal University(Engineering and Technology Edition))
年 卷 期:2009年第9卷第4期
页 面:57-62,72页
学科分类:08[工学] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金(60873176) 江苏省自然科学基金(BK2008430)资助项目
摘 要:分类是当前机器学习的重要研究内容之一,已取得了一定的进展.现有的文本分类方法大多基于VSM模型,而VSM未能有效地利用隐含在文本中的结构信息.同时,VSM下的样本空间常常是高维的,单一的降维策略可能会丢失有用信息.为改进现有算法的不足,提出了一种基于多模态模型的随机子空间分类集成算法MMRFSEn,有效地利用文本中的结构信息(单词分布位置的均值和标准差),且各基分类器是由随机选择的子空间构建而成.实验结果表明,该方法是有效可行的.