一种基于格的隐私保护聚类数据挖掘方法
Privacy Preserving Cluster Mining Method Based on Lattice作者机构:软件工程国家重点实验室(武汉大学)湖北武汉430072 武汉大学计算机学院湖北武汉430072
出 版 物:《软件学报》 (Journal of Software)
年 卷 期:2017年第28卷第9期
页 面:2293-2308页
核心收录:
学科分类:08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 081202[工学-计算机软件与理论]
基 金:国家自然科学基金(61232002 61572378 61202034) CCF中文信息技术开放课题(CCF2014-01-02) 武汉市创新团队项目(2014070504020237) 武汉大学自主科研项目(2042016gf0020 2016-2017)~~
主 题:数据挖掘 隐私保护 隐私保护的数据挖掘 基于格的加密
摘 要:由于云计算的诸多优势,用户倾向于将数据挖掘和数据分析等业务外包到专业的云服务提供商,然而随之而来的是用户的隐私不能得到保证.目前,众多学者关注云环境下敏感数据存储的隐私保护问题,而隐私保护数据分析的相关研究还比较少.但是如果仅仅为了保护数据隐私,而不对大数据进行挖掘分析,大数据也就失去了其潜在的巨大价值.提出了一种云计算环境下基于格的隐私保护数据挖掘方法,利用格加密构建隐私数据的安全同态运算方法,并且在此基础上实现了支持隐私保护的云端密文数据聚类分析数据挖掘服务.为保护用户数据隐私,用户将数据加密之后发布给云服务提供商,云服务提供商利用基于格的同态加密算法实现隐私保护的k-means、隐私保护层次聚类以及隐私保护DBSCAN数据挖掘服务,但云服务提供商并不能直接访问用户数据破坏用户隐私.与现有的隐私数据发布方法相比,隐私数据发布基于格的最接近向量困难问题(CVP)和最短向量困难问题(SVP)具有很高的安全性.同时,有效保持了密文数据间距离的精确性.与现有研究相比,挖掘结果也具有更高的精确性和可用性.对方法的安全性进行了理论分析,并设计实验对提出的隐私保护数据挖掘方法效率进行评估,实验结果表明,提出的基于格的隐私保护数据挖掘算法与现有的方法相比具有更高的数据分析精确性和计算效率.