咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于基数树的车联网轨迹数据发布方案 收藏
基于基数树的车联网轨迹数据发布方案

基于基数树的车联网轨迹数据发布方案

作     者:朱琪 

作者单位:河北大学 

学位级别:硕士

导师姓名:田俊峰

授予年度:2024年

学科分类:08[工学] 0839[工学-网络空间安全] 0838[工学-公安技术] 081201[工学-计算机系统结构] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

主      题:车联网 轨迹数据 基数树 差分隐私 马尔可夫链 

摘      要:车联网中产生的位置和轨迹信息为路网规划和智慧交通的发展提供了充足的数据支撑。然而,这些数据中存在很多敏感信息,直接将其进行发布与使用将会带来严重的隐私泄露风险。在现有的面向轨迹数据发布的隐私保护研究中,往往遵循“泛化-发布的处理框架。在泛化阶段,将敏感的位置泛化成一个区域,并利用差分隐私技术向敏感数据中添加Laplace噪声,在发布阶段利用树结构存储轨迹数据并对敏感数据进行处理。但是存在以下几个问题:轨迹具有时空特性,涉及时间戳、语义等信息,现有工作对此考虑不周全,影响轨迹隐私保护的合理性;过度添加Laplace噪声会大大降低轨迹数据的可用性;在使用树结构对轨迹数据进行处理时,往往都隐含地假定数据集中的轨迹具有相同的前缀,然而在现实生活的轨迹数据集中几乎不存在相同的前缀,这使得在处理大量轨迹数据时会出现树的高度过高和存储空间消耗大的问题。针对上述问题,本文做了如下工作: (1)针对位置轨迹的隐私保护研究中存在的对于位置的时空特性、语义信息等考虑不周全的问题,提出了一种融入驻留区域的差分隐私轨迹数据发布方案。该方案对原始轨迹进行预处理,通过划分语义等价类为轨迹中的位置点分配语义敏感度,划分驻留区域并用基准点加以替代,大大精简了原始轨迹;定义了一种满足差分隐私的基数树结构,将轨迹数据存入基数树,缓解了因树的高度过高而导致的空间消耗大的问题;向基数树的敏感信息中添加噪声,并利用马尔可夫链以及隐私度对添加的噪声加以约束。 (2)针对现有研究方案中存在的差分隐私技术利用不合理、树的高度过高以及空间消耗大的问题,提出了一种基于基数树的轨迹数据发布方案。该方案引入时间因素,综合考虑轨迹时空特征,然而时间因素的引入使得轨迹数据变得稀疏,难以承受过大的噪声量。为此,本文通过时间戳将轨迹数据划分成多个位置平面,并利用基于网格索引的位置泛化方法进行聚类和泛化,既减少了引入时间因素带来的稀疏性,又解决了现实生活的轨迹数据中几乎没有相同前缀的问题;利用有向图和最短路径算法合成用于发布的新轨迹数据;提出了一种新的添加噪声的方法,与传统逐层添加噪声的方法相比,本文方法将Laplace噪声与马尔可夫链相结合,大大降低了噪声的添加成本,提高了轨迹数据的可用性。 实验表明,上述方法在保证预期隐私水平的同时,比基线方法具有更好的数据可用性。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分