数据规范化方法对K近邻分类器的影响
Influence of Data Normalization Methods on K-Nearest Neighbor Classifier作者机构:南京师范大学计算机科学与技术学院南京210097 江苏省信息安全保密技术工程研究中心南京210097
出 版 物:《计算机工程》 (Computer Engineering)
年 卷 期:2010年第36卷第22期
页 面:175-177页
核心收录:
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:江苏省高校自然科学研究基金资助项目(09KJB520007) 南京师范大学科研启动基金资助项目(2009101XGQ0066) 航空科学基金资助项目(20090152001) 江苏省产学研前瞻性联合研究基金资助项目(BY2009100)
摘 要:讨论最小-最大规范化、z-score规范化及小数定标规范化3种方法对K近邻分类器性能的影响,在12个标准UCI真实数据集和1个人工数据集上进行实验比较。实验结果表明,规范化方法在大部分数据集能上提高K近邻分类器的识别率。针对实验结果研究据规范化方法提升分类器性能的内在原因,给出根据数据属性的数值分布特点决定是否使用数据规范化方法的一般准则。