双层随机游走半监督聚类
Semi-Supervised Clustering via Two-Level Random Walk作者机构:扬州大学信息工程学院计算机系江苏扬州225009
出 版 物:《软件学报》 (Journal of Software)
年 卷 期:2014年第25卷第5期
页 面:997-1013页
核心收录:
学科分类:08[工学] 081104[工学-模式识别与智能系统] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金(61003180 61070047 61103018) 江苏省自然科学基金(BK2010318) 江苏省教育厅自然科学基金(13KJB520026 09KJB20013) 江苏省研究生科技创新计划(CXLX12_0917) 扬州大学新世纪人才计划
摘 要:半监督聚类旨在根据用户给出的必连和不连约束,把所有数据点划分到不同的簇中,从而获得更准确、更加符合用户要求的聚类结果.目前的半监督聚类算法大多数通过修改已有的聚类算法或者结合度规学习,使聚类结果与点对约束尽可能地保持一致,却很少考虑点对约束对周围无约束数据的显式影响程度.提出一种由在顶点上的低层随机游走和在组件上的高层随机游走两部分构成的双层随机游走半监督聚类算法,其中,低层随机游走主要负责计算选出的约束顶点对其他顶点的影响范围和影响程度,称为组件;高层随机游走则进一步将各个点对约束以自适应的强度在组件上进行约束传播,把它们在每个顶点上的影响综合在一个簇指示矩阵中.UCI数据集和大型真实数据集上的实验结果表明,双层随机游走半监督聚类算法比其他半监督聚类算法更准确,也比较高效.