咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >满足本地化差分隐私的多维数据发布关键技术研究 收藏
满足本地化差分隐私的多维数据发布关键技术研究

满足本地化差分隐私的多维数据发布关键技术研究

作     者:刘高源 

作者单位:山东大学 

学位级别:硕士

导师姓名:胡程瑜;郭山清

授予年度:2023年

学科分类:08[工学] 081201[工学-计算机系统结构] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

主      题:本地化差分隐私 数据发布 多维数据 集值数据流 

摘      要:随着智能设备的普及和大数据时代的到来,每天都在产生海量的数据信息,这些数据涵盖了各个领域。通过收集和分析数据,帮助数据收集者更好地理解数据拥有者的行为、偏好和需求,使得数据收集者能够做出更好的决策和制定更有效的战略,从而改进服务质量,提高服务满意度。然而,大数据时代也带来了一系列的问题和挑战。数据中往往包含大量的个人敏感信息,无论是在数据收集或是发布阶段,直接进行数据收集与发布将导致个人隐私信息泄露。随着数据安全和隐私保护逐渐得到人们重视,隐私保护技术也不断加强。本地化差分隐私(Local differential privacy)技术作为当前最先进的隐私保护技术之一,得到越来越多的关注。然而,现有的工作主要关注满足本地化差分隐私的单维数据收集和发布任务,对于满足本地化差分隐私的多维数据发布问题的研究刚刚起步。因此,本文针对多维数据、集值数据流两种典型的多维数据,对满足本地化差分隐私的多维数据发布问题进行了深入的研究,并做出了如下贡献:(1)提出了一种新的满足本地化差分隐私的多维数据发布方法,称为PrivIncr。在该方法中,首先基于所构建的概率图模型的稀疏性以及本地化差分隐私的可分割性,提出了基于增量学习的概率图模型构建方法。其主要思想是通过逐步地修剪具有较弱相关性的边(属性对),将更多的数据和隐私预算分配给有用的边,从而提高了所构造的概率图模型的准确性。特别的,在该方法中,引入了高精度的数据积累技术和低误差的边修剪技术,以提升模型构造精度和效率。其次,基于联合分布分解和冗余消除,提出了新的本地化差分隐私大团联合分布计算方法,有效解决了联结树中大团联合分布计算问题。通过实验表明,PrivIncr方法能达到理想的数据效用,并有效地降低通信开销。(2)首次解决了满足本地化差分隐私的集值数据流发布问题。在本文中,首先基于自适应预算划分策略,提出了一种有效的基线方法PrivSVS。该方法通过定义非相似误差和发布误差两个变量,以量化相邻时间戳的分布波动情况,并自适应的选择合适的策略(发布策略或近似策略)进行统计信息发布。此外,为了进一步降低效用损失和通信成本,基于集值数据中各项分布估计的独立性,以及集值数据流的波动特性,进一步提出了优化方法,称为Optimized-PrivSVS。其主要思想是,若观察到某些项的分布在当前时间戳的波动较小时,直接采用近似策略发布这些项的分布,更多的数据和隐私预算被用于其他项的分布估计,从而提高估计精度。实验结果表明,PrivSVS和Optimized-PrivSVS均能够达到有效的数据精度,且Optimized-PrivSVS方法具有显著的性能提升。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分