咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >面向政务数据共享的隐私保护方法研究与实现 收藏
面向政务数据共享的隐私保护方法研究与实现

面向政务数据共享的隐私保护方法研究与实现

作     者:胡雄伟 

作者单位:西安电子科技大学 

学位级别:硕士

导师姓名:张琛

授予年度:2022年

学科分类:12[管理学] 1204[管理学-公共管理] 120401[管理学-行政管理] 08[工学] 081201[工学-计算机系统结构] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

主      题:政务数据共享 联邦学习 隐私保护 高效通信 多密钥全同态加密 

摘      要:政务数据作为政府部门履行职能的重要资源,在促进经济发展、提高社会治理水平等方面上有着难以估量的战略价值,大力推进政务数据开放共享是“十四五规划中的重要课题。而数据安全作为政务数据开放共享的核心基础,影响政务数据价值实现和作用发挥。随着各地政务数据开放共享的进程逐步加快和新兴技术的不断发展,传统的政务数据共享模型存在共享效率低、隐私泄露风险大、可控性差等问题无法满足面向社会公众和政府部门间的高效安全的共享需求。针对这些问题,本文对政务数据的隐私等级及访问权限进行了划分,根据不同场景下的共享需求设计了三种方法,具体研究内容如下:设计了云-雾-端联邦分层的隐私保护政务数据共享方法。针对隐私等级较低的政务数据,满足社会公众和不同政务部门对数据利用分析的安全共享需求。该共享方法将原始数据保留在端层、隐私处理数据存储在雾层、预共享数据的属性信息文件发布在云层为隐私安全的核心,设计面向不同参与方的数据共享策略,保证共享数据的安全性的同时提高政务数据的共享效率。在整个数据共享的流程中,参与共享的主体需要不断地维护更新共享事件记录,使得共享流程更加透明,在出现数据共享失败的情况时对问题快速溯源、厘清责任归属提供有力支持。设计了基于多密钥全同态加密的簇联邦增强主动学习方法(Cluster Federated Enhanced Active Learning based on Multi-key Fully Homomorphic Encryption,CFedEALM)。针对隐私等级较高的政务数据,为了满足政府部门通过协同训练模型破除“数据孤岛现象的高效安全共享需求,CFed EAL-M实现本地客户端模型的高效训练和服务器端的安全聚合。对于本地训练模型,设计了簇客户端增强主动学习算法(Enhanced Active Learning in Cluster Training,EALCT),在客户端监督数据不足、数据标注困难、数据呈非独立同分布的情况下有效训练优化机器学习模型,提升模型性能和泛化能力。对于服务器端聚合模型参数,设计了基于多密钥全同态加密的联邦安全聚合算法(Federated Secure Aggregation based on Multi-key Fully Homomorphic Encryption,Fed SA-M),保证模型参数在传输、聚合过程中的隐私安全,抵御攻击者的恶意攻击。通过对CFed EAL-M的安全性分析以及多个不同学习任务的对比试验,结果表明本文所提出的方法在保证政务数据和模型参数安全的同时充分提高了模型的性能。设计了基于CFedEAL-M的联邦学习高效通信方法(Communication-Efficient Federated Learning,CEFL)。针对CFedEAL-M方法中存在的高额通信开销易导致联邦学习不可行的问题,本文提出在减少单轮通信轮次的通信总比特数和减少通信总次数两个方面减少通信开销。对于本地模型训练过程中,利用-稀疏模型压缩算法(-Sparse Model Compression,-SMC)将模型参数稀疏化,压缩模型大小以降低通信带宽。对于模型参数聚合过程中,提出了联邦学习异步时间加权聚合算法(Federated Learning with Asynchronous Temporally Weighted Aggregation,Fed ATWA),解决同步通信所带来的“短板效应减少通信过程中的等待时间,并根据时间加权聚合算法保证模型聚合的时效性。实验结果表明,本文提出的CEFL方法在不损失模型性能的前提下减少了通信开销。根据不同政务数据在不同场景下的共享需求,本文分别提出了不同的隐私保护方法和模型训练算法,在保证共享数据的隐私安全前提下实现高效共享、高效训练、高效通信。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分