使用对抗样本加强高级持续性威胁检测
作者单位:吉林大学
学位级别:硕士
导师姓名:李强
授予年度:2022年
学科分类:0839[工学-网络空间安全] 08[工学]
主 题:高级持续性威胁 机器学习 对抗样本 对抗攻击 对抗训练
摘 要:高级持续性威胁(Advanced Persistent Threat,简称APT)指的是由高级攻击者利用先进的攻击手段对特定目标进行持续时间长的网络攻击。基于主机的检测和基于网络的检测是两种有效检测APT攻击的方法。基于主机的检测通过检测独立主机上的恶意行为从而发现APT攻击,基于网络的检测通过发现异常的网络数据信息进而检测APT。无论是基于主机的检测还是基于网络的检测,都使用到了机器学习方法。近年来,利用机器学习方法来检测APT攻击的研究已经取得了很大进展。但目前的工作依然面临着以下问题:1.没有考虑到检测APT攻击的机器学习方法可能受到对抗样本的攻击。机器学习模型由于其过于线性化而容易受到对抗样本的攻击,进而模型无法有效检测APT。2.没有对训练出来的机器学习模型做相应的防御对抗攻击措施或增加机器学习模型的鲁棒性。现有工作训练出来的APT检测模型没有考虑到其模型可能会受到对抗样本的攻击,自然也没有考虑到如何去防御对抗样本。本文主要针对以上问题进行研究,具体工作内容如下:1.使用对抗样本攻击了APT检测模型。本文首先生成了四个采用不同机器学习方法的APT检测模型,其中效果最好的模型的F1值为0.9791。接着针对APT流量的特点,提出了在APT领域的对抗样本生成算法。利用所提出的算法,本文实现了对APT检测模型的灰盒攻击和黑盒攻击,灰盒攻击使得支持向量机模型的检测成功率从98.52%下降到1.47%,黑盒攻击效果最好的模型的检测成功率从78.26%下降到0.13%。实验结果表明,使用对抗样本能够成功攻击基于机器学习的APT攻击检测模型。2.使用对抗样本对抗训练了APT攻击检测模型。本文通过生成的对抗样本,对APT检测模型进行了对抗训练。实验结果表示,在对抗训练后,提高了支持向量机模型,随机森林模型,逻辑回归模型的成功率均提高到了99%以上,即提高了模型应对对抗攻击的能力和模型的鲁棒性。