可拓K近邻算法在数据聚类分析中的应用
Data cluster based on extension K nearest neighbor algorithm作者机构:湖北民族学院理学院湖北恩施445000
出 版 物:《计算机工程与应用》 (Computer Engineering and Applications)
年 卷 期:2010年第46卷第21期
页 面:156-159页
核心收录:
学科分类:08[工学] 0835[工学-软件工程] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:湖北省教育厅青年基金(No.B200929001) 湖北民族学院博士基金 湖北民族学院青年基金
摘 要:针对区间值数据的数据聚类问题,根据可拓学关联函数的定义,提出可拓距离的概念来度量数据之间的距离,利用K近邻的思想,根据可拓距离的大小对数据集的目标属性进行投票选择进行分类,设计了可拓K近邻算法(Extension K Nearest Neighbor,EKNN)。最后利用UCI的两个基准数据集Iris植物样本数据和糖尿病数据库PIDD进行验证,首先通过免疫网络约简算法对条件属性进行最小属性约简,然后利用EKNN算法分析和比较不同最小约简属性下的分类准确率。