云存储系统中基于可信第三方的数据保护机制的研究
作者单位:江苏大学
学位级别:硕士
导师姓名:聂文惠
授予年度:2018年
学科分类:08[工学] 081201[工学-计算机系统结构] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:随着大数据时代的到来及移动互联网络的发展,用户需要存储的数据量也呈指数级增长。云计算技术凭借其方便快捷、安全高效、按量收费等特点得到越发广泛的应用,个人及企业也愈加倾向于将一些未涉密数据存储于云端。然而,由于用户对其存储于云端的数据无法直接进行管理,且难以确保自己享受的云存储服务持续可用,也不能断言云存储服务提供商不对其隐私数据进行泄漏,对于云存储服务提供商是否完整存储了用户数据也无法做出准确判断。为解决这些安全问题,本文首先对传统的隐式数据分割算法进行了改进,通过混淆技术消除数据之间的关联性;然后通过引入可信第三方,重新设计了数据存储流程,实现了文件信息和用户信息的隔离,并从物理底层对分割后的所有数据子块隔离存储;最后,利用差分隐私算法,对云存储服务提供商是否完整存储用户文件数据进行验证。具体工作包括以下三个方面:首先,为了解决传统的基于隐式数据分割算法可能存在的信息泄漏问题,提出了两次随机均匀混淆方案,该方案利用两次随机化处理消除子块之间及子块内部的数据关联性,让包含原始数据块的信息熵均匀分布于各子块数据,进而使得各子块数据无法泄漏原始文件的有关信息,以实现将用户原始数据块分割并分块存储;并对分割后的子块数据的合并重组算法重新进行了设计,通过将子块数据重组为矩阵,来方便对原始数据块的恢复。模拟实验结果表明,该算法与传统的基于隐式数据分割算法相比,虽然会给系统带来额外的资源消耗,但却提供了更好的安全性,同时,由于将大块数据分割成多个子块数据进行存储,所以能够更高效地利用磁盘的物理存储空间。其次,为了解决让不同数据分块存储于不同物理介质的问题,引入了可信第三方以及多提供商机制,并提出了一个云存储模型,从数据存储、数据访问、数据删除等操作流程对模型进行了描述,解决了数据分割后如何确保分块数据存储于不同物理服务器的问题。与传统的云存储模型相比,该云存储模型不仅实现了所有子块数据的物理隔离存储;同时,通过可信第三方的介入,实现将数据信息与用户身份信息的隔离,使得云存储服务提供商无法直接获取用户身份信息,对用户隐私进行了保护。安全性分析和模拟实验的结果表明,所提出的模型虽然会增加完成数据存储操作的时间,但整体的安全性却提高了50%以上。最后,为了验证云存储服务器中是否完整存储用户上传的数据,基于前面提出的云存储模型,通过可信第三方对云存储服务提供商进行数据块摘要信息的轮询,来判断云存储服务器是否完整存储了分块数据。首先,云存储服务器对数据块进行消息摘要,并利用拉普拉斯差分隐私算法对摘要信息添加噪声;然后将加噪后的数据交由可信第三方进行验证。达到了既能够准确对云存储服务器进行数据持有性验证,又能够有效避免攻击者利用数据持有验证来获取任何关于用户数据块相关信息的目的。