分类不平衡协议流的机器学习算法评估与比较
Machine Learning Algorithms for Classifying the Imbalanced Protocol Flows:Evaluation and Comparison作者机构:哈尔滨工业大学计算机科学与技术学院计算机网络与信息安全技术研究中心黑龙江哈尔滨150001
出 版 物:《软件学报》 (Journal of Software)
年 卷 期:2012年第23卷第6期
页 面:1500-1516页
核心收录:
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金(60903166) 国家重点基础研究发展计划(973)(2007CB311101 2011CB302605) 国家高技术研究发展计划(863)(2010AA012504 2011AA010705)
摘 要:网络协议流不平衡环境下,流样本分布的变化对基于机器学习的流量分类器准确性及稳定性有较大的影响.选择合适的机器学习算法以适应网络协议流不平衡环境下的在线流量分类,显得格外重要.为此,首先通过单因子实验设计,验证了C4.5决策树、贝叶斯核估计(NBK)和支持向量机(SVM)这3种分类算法统计TCP连接开始的前4个数据包足以分类流量.接着,比较了上述3种分类算法的性能,发现C4.5决策树的测试时间最短,SVM分类算法最稳定.然后,将Bagging算法应用到流量分类中.实验结果表明,Bagging分类算法的稳定性与SVM相似,且测试时间与建模时间接近于C4.5决策树,因此更适于在线分类流量.