基于Attention-1DCNN-CE的加密流量分类方法
作者机构:山西大学自动化与软件学院 山西清众科技股份有限公司 山西大学计算机与信息技术学院 嵌入式系统与服务计算教育部重点实验室(同济大学) 清华大学计算机科学与技术系
出 版 物:《计算机应用》 (Journal of Computer Applications)
年 卷 期:2024年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 0839[工学-网络空间安全] 08[工学] 081104[工学-模式识别与智能系统] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:山西省应用基础研究计划(20210302123444)
主 题:网络安全 加密流量 注意力机制 一维卷积神经网络 数据不平衡 成本敏感矩阵
摘 要:针对传统加密流量识别方法存在多分类准确率低、泛化性不强以及易侵犯隐私等问题,提出一种结合注意力(Attention)机制与一维卷积神经网络(1DCNN)的多分类深度学习模型—Attention-1DCNN-CE。该模型包含3个核心部分:1)数据集预处理阶段,保留原始数据流中数据包间的空间关系,并根据样本分布构建成本敏感矩阵;2)在初步提取加密流量特征的基础上,利用Attention和1DCNN模型深入挖掘并压缩流量的全局与局部特征;3)针对数据不平衡这一挑战,通过将成本敏感矩阵与交叉熵(CE)损失函数相结合,显著提升了少数类别样本的分类精度,进而优化了模型的整体性能。在两个数据集BOT-IOT和TON-IOT上的实验结果表明,该模型的整体识别准确率高达97%以上,并且在公共数据集ISCX-VPN和USTC-TFC上表现优异,在不需要预训练的前提下,达到了与ET-BERT相近的性能,相较于PERT在应用类型检测中F1指标提升了29.9个百分点,进一步验证了该方法的有效性,为加密流量识别和恶意流量检测提供了新的解决方案。