基于循环神经网络的离线口令集生成方案
作者单位:华东师范大学
学位级别:硕士
导师姓名:刘虹
授予年度:2019年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:用户认证 口令分析 口令生成 口令强度评价 循环神经网络
摘 要:在互联网技术普及的今天,出现了多种多样的用户身份认证方式,口令认证仍以其简单易用性作为网络用户身份认证的一种主流方式。但口令认证本身有许多的缺陷性。在以往的研究中,口令认证一直受到计算机安全相关的科研人士的高度重视,提出了一些破解以及评估口令安全性的方案。本文首先对网络上泄漏的口令集进行统计学分析,之后结合循环神经网络和自然语言处理技术,提出了两种离线口令生成方法。具体的研究内容包括:·通过对收集的8类用户口令集进行多维度的分析,研究用户口令分布的特征。包括对口令进行频率统计来发现用户经常使用的口令有哪些;对口令文本结构分布进行统计,来研究用户设置口令的习惯;对长度分布进行分析来研究用户对口令长短选择的偏好。之后,我们通过用包含个人信息的口令集来分析用户重用口令的行为,以及个人信息对用户设置口令的影响。·通过对口令集的分析结果,我们发现不同用户群体在设置口令的时候具有一定程度的相似性。基于这一观察现象,我们提出了一种基于群组属性的神经网络口令生成模型。该模型考虑了不同用户群体设置口令的习惯,能够有针对性的生成特定用户全体的口令集。同时,我们也基于该模型提出了一种基口令概率的强度评价方法。·由于传统的基于字符级别的口令生成模型没有考虑到用户的语言习惯,会生成一些毫无意义的字符序列,降低了口令猜测的效率。本文对此模型进行了改进。首先使用一种基于隐马尔可夫模型的口令分词算法,将口令分解成词元;然后以词元作为口令的基本单位,结合词向量技术来设计生成模型,使其能够生成更为真实的口令集。最后,基于隐马尔可夫模型和循环神经网络模型来构造了一种基于口令概率的攻击策略,一定程度上提高了口令猜测的效率。