基于边缘样本的智能网络入侵检测系统数据污染防御方法
Data Contamination Defense Method for Intelligent Network Intrusion Detection Systems Based on Edge Examples作者机构:哈尔滨工业大学网络空间安全学院哈尔滨150001 鹏城实验室广东深圳518055
出 版 物:《计算机研究与发展》 (Journal of Computer Research and Development)
年 卷 期:2022年第59卷第10期
页 面:2348-2361页
核心收录:
学科分类:0839[工学-网络空间安全] 08[工学] 081201[工学-计算机系统结构] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家重点研发计划项目(2020YFB1406902) 广东省重点领域研究研发计划项目(2020B0101360001) 深圳市科学技术研究发展基金项目(JCYJ20190806143418198) 中央高校基本科研业务费专项资金项目(HIT.OCEF.2021007) 鹏城实验室项目(PCL2021A02)
主 题:网络入侵检测 数据污染 投毒攻击 生成对抗网络 边缘样本
摘 要:人工智能已被广泛应用于网络入侵检测系统.然而由于流量样本存在概念漂移现象,用于恶意流量识别的模型必须频繁更新以适应新的特征分布.更新后模型的有效性依赖新增训练样本的质量,所以防止数据污染尤为重要.然而目前流量样本的污染过滤工作仍依赖专家经验,这导致在模型更新过程中存在样本筛选工作量大、模型准确率不稳定、系统易受投毒攻击等问题.现有工作无法在保证模型性能的同时实现污染过滤或模型修复.为解决上述问题,为智能网络入侵检测系统设计了一套支持污染数据过滤的通用模型更新方法.首先设计了EdgeGAN算法,利用模糊测试使生成对抗网络快速拟合模型边缘样本分布.然后通过检查新增训练样本与原模型的MSE值和更新后模型对旧边缘样本的F分数,识别出污染样本子集.通过让模型学习恶意边缘样本,抑制投毒样本对模型的影响,保证模型在中毒后快速复原.最后通过在5种典型智能网络入侵检测系统上的实验测试,验证了提出的更新方法在污染过滤与模型修复上的有效性.对比现有最先进的方法,新方法对投毒样本的检测率平均提升12.50%,对中毒模型的修复效果平均提升6.38%.该方法适用于保护任意常见智能网络入侵检测系统的更新过程,可减少人工样本筛选工作,有效降低了投毒检测与模型修复的代价,对模型的性能和鲁棒性起到保障作用.新方法也可以用于保护其他相似的智能威胁检测模型.