滑块验证码人机识别系统特征选择及应用研究
作者单位:长沙理工大学
学位级别:硕士
导师姓名:梁小林;黄世平
授予年度:2017年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 0839[工学-网络空间安全] 08[工学]
摘 要:随着互联网的不断发展,相伴而生网络技术也日益凸显,在网络给人们提供了丰富资源、快捷生活的同时,网络环境安全性也日渐突出。为了保证网络的安全运行,网络的注册、登陆、搜索等验证变得尤为重要,互联网公司、政府等部门继而投入了人力、物力和财力等来防止非法行为的暴力攻击,借此提高网站的安全性和黑客的抗攻击性。因此,提高验证识别技术和技术的探索与研究,保护网络安全方面具有十分重要意义。目前,网络验证码的运用领域,分为数字与字母组合验证码、手机短信验证码、滑动匹配验证码、视频验证码等。针对验证识别过程需要经过复杂程序,每一个环节的实施都会影响到验证结果的成效。目前识别技术主要涉及图像处理、字符分割、模式分类等技术,鉴于网络的复杂性、多样性,验证码的使用存在差异性,因此对其验证技术的研究具有重要的实践意义。本文以验证码分类中的滑动匹配验证码为例进行研究,首先,对来访用户的滑动浏览轨迹数据信息进行一系列的分析,并对获得数据信息进行预处理之后,提取了 12个特征指标。其次,基于指标的重要程度的分析研究,分别采用了主成分分析法、Logistic系数法、CRITIC三种方法,对12个特征指标获得三种不同的排序;为了保证数据信息的充分利用以及排序结果的稳健性,对三种不同的排序结果利用一致度组合方法得出了组合后的特征排序,利用这种组合排序的结果相对比较合理而且具有科学性;最后,对于一致度组合排序后的结果,利用K近邻分类算法在不同的K值下对组合特征进行模式识别,最终得到10个特征指标。进一步分析结果表明,在同一 K值下,随着特征的增加识别率逐渐增加,但会趋向稳定,同样的特征指标在不同的K值下具有一定程度的差异,但是随着识别率的提高,最后都达到了 90%左右,最后的两个指标虽然一定程度上对识别率的提高有影响,但是对识别率的提高影响很小,通过对测试数据集的验证,进一步验证了结果,这些结果的分析在某种程度上给公司、政府等决策者提供一些参考价值。最后,在总结文章的研究的基础之上,指出了有待研究的方向。