基于杂度增益与层次聚类的数据匿名方法
A Data Anonymization Approach Based on Impurity Gain and Hierarchical Clustering作者机构:中南财经政法大学信息与安全工程学院武汉430074 武汉工业学院计算机与信息工程系武汉430023
出 版 物:《计算机研究与发展》 (Journal of Computer Research and Development)
年 卷 期:2012年第49卷第7期
页 面:1545-1552页
核心收录:
学科分类:0839[工学-网络空间安全] 08[工学] 081201[工学-计算机系统结构] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金项目(70903076) 中央高校基本科研业务费专项基金项目(31540911202)
摘 要:数据匿名是发布数据时对隐私信息进行保护的重要手段之一.对数据匿名的基本概念和应用模型进行了介绍,探讨了数据匿名结果应该满足的要求.为了抵制背景知识攻击,提出了一种基于杂度增益与层次聚类的数据匿名方法,该方法以杂度来度量敏感属性随机性,并以概化过程中信息损失最小、杂度增益最大的条件约束来控制聚类的合并过程,可以使数据匿名处理后的数据集在满足k-匿名模型和l-多样模型的同时,使数据概化的信息损失最小且敏感属性的取值均匀化.在实验部分,提出了一种对数据匿名结果进行评估的方法,该方法将匿名结果和原始数据进行对比,并从平均信息损失和平均杂度2个方面来评估数据匿名的质量.实验结果验证了以上方法的有效性.