咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >具有全局聚类的多属性离散化算法 收藏

具有全局聚类的多属性离散化算法

Synchronized Continuous Attributes Discretization Based on Ameva

作     者:刘弹 杨景明 罗爱玲 LIU Dan;YANG Jingming;LUO Ailing

作者机构:西安交通大学机械制造系统工程国家重点实验室西安710049 

出 版 物:《西安交通大学学报》 (Journal of Xi'an Jiaotong University)

年 卷 期:2011年第45卷第9期

页      面:1-5页

核心收录:

学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家自然科学基金资助项目(51105296) 机械制造系统工程国家重点实验室开放课题资助项目 中央高校基本科研业务费专项资金资助项目 

主  题:统计量 连续属性 离散化 

摘      要:为了减少连续属性离散化后有用信息的丢失和信息系统总的断点数量,提出了一种具有全局聚类效果的多属性离散化算法.算法根据各属性预插入断点对信息系统近似分类质量的影响,来确定要插入断点的属性,从全局属性范围选择最佳断点.根据Ameva统计量来判断属性中最佳断点的位置,并以保证决策表的近似分类质量作为算法的终止条件.实验采用多组机器学习数据对算法的性能进行了检验,并与几种经典算法做了对比.实验结果表明,用新的离散化算法获得的结果所建的C45决策树分类模型,具有较好的分类精度和较少的节点数量.

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分