基于信息熵理论的连续属性离散化方法
A New Discretization Method for Continuous Attributes Based on Information Entropy作者机构:廊坊师范学院计算机系河北廊坊065000
出 版 物:《微电子学与计算机》 (Microelectronics & Computer)
年 卷 期:2011年第28卷第7期
页 面:187-189,194页
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:很多数据挖掘和机器学习方法仅仅依赖于离散值的属性,这样必须离散连续的属性.文中提出一种基于信息熵理论的数据离散化方法(IED),利用信息熵的思想衡量离散区间是否类似,同时考虑离散区间大小对离散化结果的影响,该方法综合考虑了离散区间与类之间的独立性.实验结果表明,IED显著地提高了Na ve-bayes分类学习精度.