面向差分隐私保护的随机森林算法
Random Forest Algorithm for Differential Privacy Protection作者机构:中南大学计算机学院长沙410083 中南大学医疗大数据应用技术国家工程实验室长沙410083 中南大学信息安全与大数据研究院长沙410083
出 版 物:《计算机工程》 (Computer Engineering)
年 卷 期:2020年第46卷第1期
页 面:93-101页
学科分类:08[工学] 0839[工学-网络空间安全] 081201[工学-计算机系统结构] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家重点研发计划(2016YFC0901705) 湖南省自然科学基金(2018JJ2534)
主 题:隐私保护 差分隐私 随机森林 决策树 CART分类树
摘 要:数据挖掘中的隐私保护问题是目前信息安全领域的研究热点之一。针对隐私保护要求下的分类问题,提出一种面向差分隐私保护的随机森林算法RFDPP-Gini。将随机森林与差分隐私保护相结合,在隐私信息得到保护的同时提高分类的准确率。以CART分类树作为随机森林中的单棵决策树,使用Laplace机制和指数机制添加噪声并选择最佳分裂特征。实验结果表明,RFDPP-Gini算法既能处理离散型特征又能处理连续型特征,在Adult和Mushroom数据集上的分类准确率最高分别达86.335%和100%,且在加入噪声后算法的分类准确率下降幅度极小。