混合信息系统中基于邻域粗糙集的双评价三支聚类算法
Dual Evaluation Three-way Clustering Algorithm Based on Neighborhood Rough Set in the Hybrid Information System作者机构:四川师范大学计算机科学学院成都610101 可视化计算与虚拟现实四川省重点实验室(四川师范大学)成都610066 四川师范大学数学科学学院成都610066
出 版 物:《小型微型计算机系统》 (Journal of Chinese Computer Systems)
年 卷 期:2024年第45卷第10期
页 面:2394-2400页
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金项目(61673285)资助 教育部人文社科规划基金项目(23YJA630114)资助 四川省自然科学基金项目(2022NSFSC0929)资助 四川省科技计划项目(2022ZYD0001,2021YJ0085)资助
主 题:三支聚类 邻域关系 双评价函数 混合信息系统 样本相似性
摘 要:三支聚类将不确定性高的样本置于边界域,可有效解决由数据的不确定性带来的误决策问题,因此具有良好的聚类性能.为了在混合信息系统中更合理地刻画样本间的相似性和存在的不确定性,本文提出了一种基于邻域粗糙集的双评价三支聚类算法.首先,在混合信息系统中建立广义邻域关系,并分别从样本间相似属性个数和样本间距离两个角度来建立样本间相似性的两个评价函数.然后,通过引入基于双评价函数的三支决策规则,处理了广义邻域关系下样本间的相似性和存在的不确定性.最终在混合信息系统中建立了基于广义邻域关系的双评价三支聚类模型.在UCI数据集上的实验结果证明,与已有三支聚类算法相比,本文的算法在F1-score和兰德系数上都具有较好的聚类表现.