咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于信息熵理论的连续属性离散化方法 收藏

基于信息熵理论的连续属性离散化方法

A New Discretization Method for Continuous Attributes Based on Information Entropy

作     者:高建国 崔业勤 GAO Jian-guo;CUI Ye-qin

作者机构:廊坊师范学院计算机系河北廊坊065000 

出 版 物:《微电子学与计算机》 (Microelectronics & Computer)

年 卷 期:2011年第28卷第7期

页      面:187-189,194页

学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

主  题:离散化 数据挖掘 信息熵 

摘      要:很多数据挖掘和机器学习方法仅仅依赖于离散值的属性,这样必须离散连续的属性.文中提出一种基于信息熵理论的数据离散化方法(IED),利用信息熵的思想衡量离散区间是否类似,同时考虑离散区间大小对离散化结果的影响,该方法综合考虑了离散区间与类之间的独立性.实验结果表明,IED显著地提高了Na ve-bayes分类学习精度.

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分