互联网信息技术和移动终端定位技术的迅速发展,推动了各类电子智能设备的更新迭代,越来越多基于位置服务(Location Based Service,LBS)的应用走进了人们的生活。用户的位置信息通常以轨迹序列的形式存储、处理、发布。轨迹数据在城市规...
详细信息
互联网信息技术和移动终端定位技术的迅速发展,推动了各类电子智能设备的更新迭代,越来越多基于位置服务(Location Based Service,LBS)的应用走进了人们的生活。用户的位置信息通常以轨迹序列的形式存储、处理、发布。轨迹数据在城市规划、交通管理等领域都发挥了关键的作用,为现代人们的生活、科学研究和企业运行带来了巨大的变革。然而,由于轨迹数据往往包含着用户的隐私信息,如果在数据集发布之前不进行保护处理,会使用户面临隐私泄露的威胁。目前,已有许多针对轨迹隐私保护的技术方法被提出,如常用的轨迹k-匿名法、轨迹差分隐私技术等。但现有的保护方法容易降低轨迹数据的数据效用,存在如忽视位置语义信息或噪声添加过大等问题。因此,如何平衡用户的隐私需求和轨迹数据的可用性,依然是一个亟待解决的问题。本文就轨迹数据发布场景下的隐私信息保护问题展开研究,提出了两种轨迹安全发布方案,主要研究成果如下:(1)提出一种基于轨迹段图划分的隐私保护轨迹发布方法。首先,该方法根据轨迹的时间特征分割原始轨迹,获得具有不同时间戳的初始和最终轨迹段,并划分到对应的轨迹段等价类中;然后,结合网格过滤法,计算轨迹段间的形状距离,通过构造位置点语义分类树,计算起止位置点间的语义距离;接着以距离阈值和斜率差值的(d,s)-约束条件为基础,将轨迹段等价类映射为轨迹段无向图。最后,使用图划分法查找近似最优的k条轨迹,构建轨迹段k-匿名集。通过在真实数据集上进行对比评估,证明了本方法在满足一定的隐私需求的前提下提高了数据效用。(2)提出一种基于聚类的差分隐私轨迹发布方法。首先,通过识别原始轨迹的时间特征,构建轨迹时间等价类;然后利用无监督的聚类算法对每个时间戳下的位置点进行划分,形成多个聚类空间;接着,结合网格法和指数机制为聚类空间生成聚类代表元,将聚类代表元进行聚合,并从中筛选出合格的聚合轨迹,以提高发布轨迹的质量和效用;最后为聚合轨迹计数值添加噪声并进行一致性约束,得到可发布的轨迹数据集。在真实数据集上进行对比实验,结果表明本方法不仅能有效降低用户隐私泄露的风险,而且能使发布的轨迹具有较好的可用性。
暂无评论