改进乌鸦搜索算法优化支持向量机的入侵检测研究
作者单位:南京信息工程大学
学位级别:硕士
导师姓名:陈晓
授予年度:2023年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 0839[工学-网络空间安全] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:随着互联网时代的到来,其已经成为社会的重要组成部分,影响着人们生活和工作的方方面面。网络中存储的大量信息给人们的生活带来便利的同时,其中存在的恶意攻击也对人们的信息安全造成了严重威胁。入侵检测作为一种安全防御机制,通过检测和响应网络中的各种攻击来提高网络空间的安全性来免受各种漏洞和威胁。为提高入侵检测的分类性能,本文针对入侵检测数据集中的数据类别不平衡和支持向量机(SVM)分类器参数选择不当的问题,提出了一种基于改进的乌鸦搜索算法(ICSA)优化SVM参数的入侵检测模型并采用改进的自适应合成采样(KADASYN)算法来平衡入侵检测数据集,以进一步提高模型的分类性能。论文的主要研究工作如下:(1)在乌鸦搜索算法(CSA)的基础上提出了改进方案。针对乌鸦搜索算法(CSA)中乌鸦初始种群随机导致种群分布不均匀的问题,利用拉丁超立方体抽样(LHS)的稳定性和均匀性,对乌鸦种群初始化,提高了乌鸦初始种群的多样性;针对CSA算法存在的搜索能力不足和收敛速度慢的问题,利用动态感知概率代替固定感知概率,调节局部搜索和全局搜索,加速算法的收敛速度;针对CSA算法存在的易陷入局部最优的问题,在算法公式中引入莱维飞行和熵权法中的权重值对乌鸦个体赋予不同的权重,帮助CSA算法跳出局部最优极值。测试结果表明,所提的ICSA算法在参数寻优、收敛速度和鲁棒性方面拥有一定优势,验证了本文所提的ICSA算法的有效性。(2)使用ICSA算法优化SVM参数的入侵检测模型。SVM中惩罚因子和核函数参数的合理选择,对SVM分类性能和泛化能力有着极其重要的影响,本文通过ICSA算法寻得SVM的最优参数组合,再将ICSA_SVM模型用于NSL_KDD数据集进行分类。结果表明,ICSA_SVM模型在入侵检测数据集上的准确率高达92.43%。(3)在自适应合成采样(ADASYN)算法基础上融合K-means聚类算法的改进方案。ADASYN算法生成少数样本时没有考虑少数类样本之间的特征信息,提出了基于K-means和ADASYN混合算法的KADASYN算法,将所提算法用于NSL_KDD数据集,在增加少数类样本同时使用随机欠采样减少多数类样本来平衡数据,并将平衡后的数据集在ICSA_SVM入侵检测模型上进行实验。实验结果表明,所提KADASYN算法加入使得ICSA_SVM入侵检测模型在少数类别R2L和U2R上的检测率分别为92.48%和88%。