网络服务异常事件告警因果图构造方法
A method of building alarm causality graph for anomaly events in network services作者机构:中国联合网络通信集团有限公司北京100033 北京邮电大学网络与交换技术全国重点实验室北京100876 新讯数字科技有限公司北京100091
出 版 物:《电信科学》 (Telecommunications Science)
年 卷 期:2024年第40卷第5期
页 面:152-164页
学科分类:080903[工学-微电子学与固体电子学] 0809[工学-电子科学与技术(可授工学、理学学位)] 08[工学] 080501[工学-材料物理与化学] 0805[工学-材料科学与工程(可授工学、理学学位)] 080502[工学-材料学]
基 金:国家自然科学基金资助项目(No.62171057 No.62101064 No.62071067 No.62001054)
摘 要:网络服务系统中,异常事件的发生经常导致系统中产生大量告警事件,形成告警风暴。运维人员需要花费大量的时间和精力从这些告警数据中寻找关键信息、确定异常事件的根源。为了减少运维人员所需处理的告警数量,智能化、自动化地提取告警风暴中的根源告警,基于网络服务告警的传播模式分析,提出了一种告警因果图构造方法,并将其应用于提取异常事件发生时的告警风暴关键信息。实验使用运营商现网管理系统的真实数据集,通过告警风暴摘要提取实验,验证了告警因果图生成的效果,并进行了相关案例的物理意义分析。结果表明,使用告警因果图生成的方式进行告警风暴摘要提取,达到了96%的召回率,保留了绝大部分关键信息。同时,使用该方法对系统产生的告警进行压缩,对较难压缩的告警码的压缩率能够达到66.5%。