基于机器学习的日志函数自动识别方法
Logging function recognition based on machine learning technique作者机构:国防科学技术大学计算机学院湖南长沙410073
出 版 物:《计算机工程与科学》 (Computer Engineering & Science)
年 卷 期:2017年第39卷第1期
页 面:111-117页
学科分类:08[工学] 0835[工学-软件工程] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金(61379146 61272483) 腾讯高校合作项目"面向故障检测的大规模开源软件日志增强技术研究"
摘 要:随着软件规模的不断增长,日志在故障检测中发挥着愈加重要的作用。然而,目前软件日志缺乏统一标准,常受开发人员个人习惯影响,为大规模系统中日志的自动化分析带来了挑战。其中,日志函数的识别作为日志分析的前提条件,对分析结果有着直接影响。提出了一种基于机器学习的方法以支持日志自动识别。通过系统分析广泛使用的大规模开源软件,总结出日志函数编写的主要形式,并提取不同形式间的共性特征,进而基于机器学习实现了自动日志识别工具iLog。实验显示,使用iLog识别的日志函数能力平均为使用特定关键字的76倍,十折交叉验证得到iLog的分析结果的F-Score为0.93。