基于谱聚类的多维数据集异常子群挖掘方法
Method for Mining Abnormal Subgroups of Multidimensional Data Sets Based on Spectral Clustering作者机构:山西大同大学计算机与网络工程学院山西大同037009 山西大同大学山西大同037009 山西大同大学计算机网络中心山西大同037009
出 版 物:《计算机仿真》 (Computer Simulation)
年 卷 期:2023年第40卷第7期
页 面:477-480,523页
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:教育部产学合作协同育人项目(201902126005) 大同市平台基地计划项目(2020196) 山西大同大学基础研究项目(2022K9,2022K16) 山西大同大学教学改革创新项目(XJG2022201,XJG2022202)
摘 要:针对传统方法存在的异常子群挖掘结果准确性不高,挖掘效果不佳的问题,提出基于谱聚类的多维数据集异常子群挖掘方法。通过多维数据集预处理判断显著子群,依据属性值构建同阶子群,获取数据集中存在的部分候选子群;采用基于L1范数的约束谱聚类算法划分候选子群后,利用约束矩阵、二分类以及整合,完成候选子群的多分类、处理正约束点以及重现顶点的度和边,形成约化图并完成候选子群的挖掘,即实现异常子群挖掘。测试结果表明,上述方法的挖掘准确率和标准化互信息值较高,可完成指定异常子群的多维深度挖掘,且挖掘效果良好。