咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >社会网络数据发布中有效保护社区结构的匿名方法研究 收藏
社会网络数据发布中有效保护社区结构的匿名方法研究

社会网络数据发布中有效保护社区结构的匿名方法研究

作     者:王焕杰 

作者单位:广西师范大学 

学位级别:硕士

导师姓名:李先贤

授予年度:2016年

学科分类:08[工学] 081201[工学-计算机系统结构] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

主      题:社会网络 数据发布 隐私保护 社区结构 

摘      要:互联网的普及使人们的社交模式发生了深刻变化,便利的平台也为人们的社交提供了巨大的方便。随着用户数量日益增加,网络数据量也越来越大,成为了当前互联网中的一种重要资源,其中,社区结构分析是社会网络数据应用的一个重要方面,可以用于相似群体发现、群体行为模式发现,从而制定商业推荐策略以及社会行为研究等。然而,这些数据中包含有大量用户的敏感信息,如果以其原有形式发布,将会泄露个人隐私;对数据进行匿名处理,将会修改原始数据,影响发布数据的实用性。因此,发布的社会网络数据用于分析的同时,如何在数据的隐私性和效用性两个方面取得优化平衡是一个关键性问题,围绕该问题的研究已经成为信息安全和数据分析领域的热点之一。数据的效用性与数据分析的目的紧密相关,因此,为了更好地保护数据的应用价值,数据发布中采取的隐私保护方法需要考虑数据分析的目的。然而,当前的社会网络数据发布的隐私保护研究中,较少考虑发布数据的具体应用,尤其是在针对社区结构分析的应用时,采用现有的匿名方法会牺牲较大的结构信息来满足匿名要求,对社区结构性质的分析带来巨大影响,极大地降低了数据的使用价值。本文针对以社区结构分析为目的的社会网络数据发布的隐私保护开展研究,提出在社会网络数据匿名发布中有效保护社区结构信息的方法。主要的研究工作如下:首先,指出针对社区结构分析的社会网络数据匿名发布的技术问题,并分析当前的隐私保护技术用于该问题时,存在的数据效用性降低的原理以及技术局限性。即研究在子图背景知识攻击模式下,k-匿名方法由于在聚类的过程中未考虑原始的社区结构,很可能使得原始属于同一社区的节点被分散划分到不同的组中,这在重构时将会模糊社区间的边界;又由于数据分析通常是以单个的节点和边为分析单元,k-匿名数据在分析前需要对发布图中的超级节点和超级边进行重构,这样很大可能使得社区间增加一些原本不存在的边,而导致社区边界变得更加模糊,此外,完全重构会产生较多的重构可能图,这些都会对数据的真实性造成较大的影响。然后,针对社会网络数据发布的k-匿名技术在社区结构信息分析研究中存在的信息损失过大问题,结合图中分组聚类技术和随机化技术,提出了一种新的局部扰乱的隐私保护方法。在节点分组的过程中,以距离和原始社区结构信息共同作为约束条件,使得原属于同一社区的节点尽可能分到一个组内;在重构的过程中,以组为单位,组间的连接结构保持不变,即将重构操作尽可能控制在社区内部或结构相似的节点之间,这样较大程度的降低了增加或删除边带来的社区间密度增大的可能,除此之外,也减少了重构带来的可能图数量。最后,基于提出的局部扰乱数据隐私保护方法,给出了详细的算法设计和实现过程说明,并结合社区结构分析中常用的检测标准以及图的结构性质,采用了三种验证匿名后数据效用性的评价标准。依据以上内容,本文给出了详细的系统设计方案以及各模块的实现过程说明。通过在三个真实的数据集上的实验结果分析,验证了本文方法的可行性,所发布的数据在满足k-匿名要求的前提下,对做社区结构相关研究有较高的效用性。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分