基于聚类的数据敏感属性匿名保护算法
Clustering-based algorithm for data sensitive attributes anonymous protection作者机构:江苏大学计算机科学与通信工程学院江苏镇江212013 南京审计学院信息科学学院南京211815
出 版 物:《计算机应用研究》 (Application Research of Computers)
年 卷 期:2012年第29卷第2期
页 面:469-471页
核心收录:
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金资助项目(70971067) 江苏省自然科学基金基础研究计划资助项目(BK2010331)
摘 要:为了防止数据敏感属性的泄露,需要对数据敏感属性进行匿名保护。针对l-多样性模型当前已提出的算法大多是建立在概念层次结构的基础上,该方法会导致不必要的信息损失。为此,将基于属性泛化层次距离KACA算法中的距离度量方法与聚类结合,提出了一种基于聚类的数据敏感属性匿名保护算法。该算法按照l-多样性模型的要求对数据集进行聚类。实验结果表明,该算法既能对数据中的敏感属性值进行匿名保护,又能降低信息的损失程度。