基于最长连续间隔的未知二进制协议格式推断
Unknown Binary Protocol Format Inference Method Based on Longest Continuous Interval作者机构:陆军工程大学装备模拟训练中心石家庄050003 陆军工程大学指挥控制工程学院南京210007
出 版 物:《计算机科学》 (Computer Science)
年 卷 期:2020年第47卷第8期
页 面:313-318页
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 08[工学] 081201[工学-计算机系统结构] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家重点研发计划(2017YFB0802900) 江苏省自然科学基金(BK20161469)
摘 要:在未知二进制协议的格式推断过程中,常常引入大量的先验知识,实验操作复杂且准确率不高。为此,文中提出了一种人为设定较少参数、操作简单、准确率较高的方法进行未知二进制协议格式推断,将预处理的协议数据进行层次聚类,以CH(Calinski-Harabasz)系数为评价标准获得最优聚类,通过对聚类所得结果进行改进的序列对比以获得带有间隔的协议数据序列,统计合并连续间隔,以分析协议格式。实验结果表明,提出的二进制协议格式推断方法能够推断出未知二进制协议80%以上的字段间隔,相较于AutoReEngine算法中的格式推断方法,所提方法的F1-Measure值整体上提升了约30%。