基于动态切片与预训练模型的代码漏洞检测
Code Vulnerability Detection Based on Dynamic Slicing and Pre-trained Model作者机构:南京邮电大学计算机学院南京210023
出 版 物:《小型微型计算机系统》 (Journal of Chinese Computer Systems)
年 卷 期:2024年第45卷第6期
页 面:1529-1536页
学科分类:08[工学] 0835[工学-软件工程] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:代码缺陷检测 动态切片 预训练模型 Swin Transformer
摘 要:当前大部分基于深度学习的漏洞检测模型,通常以整个文件或函数作为输入,检测粒度较粗,存在准确率低下、可扩展性差等挑战.为了应对这些挑战并提升漏洞检测技术的性能,同时针对静态切片方法在发现特定执行条件下的漏洞存在不足的问题,提出了一种基于动态切片与预训练模型的代码漏洞检测方法.通过动态切片获取包含路径特征的语句块,借助CodeBERT预训练模型的语义提取能力将具有语义特征和路径特征的动态切片结果表示成二维张量;将代码结构和语义特征编码成灰度图像中的像素值,借助Swin Transformer的特征提取能力,以此更准确地进行漏洞检测.实验数据表明本文的方法取得了较好的效果,可降低误报率和漏报率,同时提高漏洞检测的准确性和可靠性.