裁剪和元分类器在分布式数据挖掘中的应用
APPLYING PRUNING AND META-CLASSIFIER IN DISTRIBUTED DATA MINING作者机构:上海交通大学计算机科学与工程系上海200240
出 版 物:《计算机应用与软件》 (Computer Applications and Software)
年 卷 期:2008年第25卷第8期
页 面:138-140页
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程]
摘 要:数据经常分布在不同的地方,需要的机器资源也随着数据量的增长按比例增长,但数据的增长往往快于机器资源和机器学习上的改进。描述了元学习的基本过程和几种组合元分类器的度量尺度。元学习能够改进可观测性和精度,但同时过度强大的元学习技术也会导致冗余,低效甚至不精确的元分类器层次。分析这些方法的局限性并且提出了基于相异性的裁剪算法,证实了元学习和相关的裁剪方法的组合能取得相似的甚至更好的表现。