咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于位置密度与距离特征的差分隐私推理攻击研究 收藏
基于位置密度与距离特征的差分隐私推理攻击研究

基于位置密度与距离特征的差分隐私推理攻击研究

作     者:汪仁杰 

作者单位:华中科技大学 

学位级别:硕士

导师姓名:左琼

授予年度:2019年

学科分类:08[工学] 081201[工学-计算机系统结构] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

主      题:移动数据隐私保护 差分隐私 推理攻击 特征提取 机器学习 

摘      要:随着信息技术的发展,各种各样基于位置的移动设备与服务广泛普及,使得包含了个人信息的移动数据呈爆炸式增长。一方面,这些移动数据可以用作商业研究,为用户提供更准确的服务;另一方面,原始的移动数据不仅包含大量个人属性,还可从中挖掘用户出行轨迹、社交关系,存在隐私泄露的风险。现有的隐私保护方法中差分隐私被广泛使用,但是对其进行推理攻击的研究却很少。通过对差分隐私进行推理攻击,发现其存在的隐私泄露场景,对未来差分隐私保护方法的完善具有现实意义。针对差分隐私存在的强独立性假设,以及经差分隐私处理后的数据依然能在一定扰动范围内保留用户的位置分布特征这两个问题,先给出扰动后的“真实数据和“虚假数据的定义。通过给定一个阈值,当扰动后位置到原始位置的距离在该阈值内,其大概率保留着原始轨迹的特征规律,则对应记录为真实数据,否则为虚假数据。基于这个概念设计了一个推理差分隐私的攻击场景,假设攻击者拥有部分真实数据作背景知识,并且利用背景知识来达到区分真假数据的目的。由此提出了一套针对差分隐私的推理攻击方法(DPIA-LDDF,Differential privacy inference attack based on location density and distance features),将每条扰动后的数据作为一个样本,从多记录中提取相关的位置密度与距离特征作为样本属性,根据数据的真实性为每个样本打上正负标签;将背景知识对应扰动后数据集的样本集作为训练集,一起训练出一个基于决策树的集成模型;将其余待推理的样本集输入该模型,可预测出每个样本的标签,即得到了每个样本对应的签到数据的真实性。设计并实现了该攻击方法,包括界定真假数据的阈值的指定算法,位置特征提取算法,基于决策树的集成算法。在多个数据集上进行实验,验证了DPIA-LDDF方法的有效性。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分