基于LLM的多媒体原生库模糊测试研究
作者机构:武汉大学国家网络安全学院 空天信息安全与可信计算教育部重点实验室
出 版 物:《信息网络安全》 (Netinfo Security)
年 卷 期:2025年
学科分类:0839[工学-网络空间安全] 08[工学] 0835[工学-软件工程] 081201[工学-计算机系统结构] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金面上项目
摘 要:多媒体原生库使用C/C++语言直接操作底层系统资源,这在显著提高音视频数据处理效率的同时,也带来了持久的内存安全威胁。然而,现有的原生库模糊测试研究一方面缺乏多媒体库的导向性,因而未能将有限的计算资源集中在高风险函数中。另一方面,由于缺乏对闭源二进制运行时的监控手段,模糊测试过程难以触发深层代码覆盖并主动捕获其中的内存错误。针对上述问题,文章提出一种基于大语言模型的模糊测试方案MediaFuzzer,实现对多媒体原生库的高效漏洞挖掘。该方案首先设计了一种自启发式的大语言模型问询方案,以准确提取蕴含在函数签名中的功能语义信息,并进而筛选出所有潜在的多媒体原生库函数作为执行入口。随后,MediaFuzzer设计并实现了一种基于模拟执行的原生库模糊测试框架。该框架能够自动为目标函数生成测试用例,并将其直接运行在模拟执行环境中。借助于模拟执行引擎的指令级翻译能力,该框架在系统依赖、内存管控、代码执行三个不同层次系统构建了完整的运行时监控机制,以实现模糊测试过程中的覆盖率导向变异以及主动内存异常行为捕获。基于500个真实移动应用的实验评估表明,MediaFuzzer从应用中成功识别出了7类共1557个多媒体函数。在进一步对这些函数执行模糊测试后,MediaFuzzer挖掘到了WhatsApp中的1个已披露漏洞,以及包括微信在内的3个零日漏洞。