云计算中基于索引的密文并行查询实现与优化
作者单位:南京邮电大学
学位级别:硕士
导师姓名:杨庚
授予年度:2017年
学科分类:0839[工学-网络空间安全] 08[工学] 081201[工学-计算机系统结构] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:可搜索加密 密文倒排索引 Lucene MapReduce 并行索引
摘 要:信息技术的发展,人们日常生产生活中产生的数据日益增长,大数据以及云计算技术成为当下炙手可热的研究领域。“数据即服务(DaaS)新型服务模式的兴起,越来越多的个人以及公司倾向于将数据保存在云端。然而,云环境开放性的特点给用户数据带来了一系列的安全问题。加密数据是保护用户隐私的一种方法,特别在开放系统中的数据处理需求更为迫切,但要解决如何在密文上进行检索的问题。本文从加密数据的可检索性实际需求出发,分析了SSE-1密文检索方案的一些性能缺陷,然后在Lucene倒排索引的基础上采用不同的加密策略,结合AES算法,设计了二级密钥结构的密文倒排索引Crypt-Lucene,给出了Crypt-Lucene的具体构造方法和算法,并对其安全性进行了分析。同时结合云计算并行计算的特点,基于MapReduce设计了并行构建Crypt-Lucene方案,实现了并行算法,并给出了密文倒排索引集合的并行检索和更新步骤。最后理论分析了并行算法的时间开销以及加速比。理论分析和实验结果表明,并行Crypt-Lucene保证了加密数据的可检索性同时能够高效地构建密文倒排索引。Crypt-Lucene与SSE-1相比,索引构建时间约减少了60%,索引检索也较SSE-1更为高效平稳。密文倒排索引空间比Lucene明文倒排索引空间仅增加了14%,具有较好的空间性能。对于大文档集合,利用MapReduce在4节点构成的Hadoop集群上并行构建8个Crypt-Lucene索引能减少83.4%的时间,能够近似达到理论加速比n,其中n为索引集合中索引个数。