基于Spark的网络流量分类方法研究
Network traffic classification based on Spark frame作者机构:北京化工大学信息科学与技术学院北京100029
出 版 物:《通信学报》 (Journal on Communications)
年 卷 期:2018年第39卷第A1期
页 面:30-36页
核心收录:
学科分类:08[工学] 081201[工学-计算机系统结构] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:网络流量分类是网络监控、服务质量和网络安全的前提和基础。为了对海量网络流量进行迅速、准确地分类,利用相似性和权重对随机森林算法进行改进,通过计算决策树相似度,消除决策冗余以加强分类性能;再用分类性能为指标设定权重构建随机森林,并结合Spark平台设计实现并行算法提高分类效率。实验结果表明,该方法提高了网络流量分类性能,同时具有可扩展性和顽健性,能够响应海量流量分类任务。