不完整数据聚类算法研究
Research on Clustering Algorithm of Incomplete Data作者机构:渤海大学信息科学与技术学院辽宁锦州121000 渤海大学管理学院辽宁锦州121000
出 版 物:《计算机技术与发展》 (Computer Technology and Development)
年 卷 期:2020年第30卷第8期
页 面:61-65,72页
学科分类:08[工学] 0835[工学-软件工程] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:辽宁省社会科学基金(L14AGL002,L13AGL002) 辽宁省教育项目(LQ2017004)
主 题:电子政务 不完整数据 聚类 相似度 KNN 数据离散
摘 要:服务类电子政务通过单向或互动的方式向社会和公民提供诸如天气、统计数据、道路交通等信息。这些服务类信息在数据采集过程中,不可避免地会出现各种各样的数据质量问题,数据的不完整性就是其中一种。数据的不完整性对后续的信息统计、挖掘都会造成严重影响。以不完整数据为研究对象,在分析了当前不完整数据聚类算法存在问题的基础上,提出一种基于KNN的不完整数据AP聚类算法。算法首先给出了连续数值型和分类型数据的相似性度量方法,然后利用AP聚类算法对数据集中的完整数据进行聚类,最后利用KNN思想将完整数据集中的吸引度矩阵和归属度矩阵扩展至整个数据集,继续执行迭代,直至收敛。实验将该算法同其他不完整数据聚类算法在聚类精度上进行比较,验证了提出的不完整数据聚类算法的有效性。