咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >软件胎记选取技术研究 收藏
软件胎记选取技术研究

软件胎记选取技术研究

作     者:马世鑫 

作者单位:解放军信息工程大学 

学位级别:硕士

导师姓名:刘粉林

授予年度:2012年

学科分类:08[工学] 0835[工学-软件工程] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

主      题:软件胎记 软件保护 软件盗用检测 胎记选取 互信息 

摘      要:软件胎记是软件内在固有的可用于程序识别的特性或特性集合。本课题首先总结了软件胎记技术的相关技术与研究现状;针对现有胎记算法所抽取的程序属性存在较大冗余问题,提出了胎记选取思想,给出了一种基于互信息的k-gram软件胎记选取算法;针对定长k-gram胎记不能体现程序语义的问题,设计了两种基于变长k-gram的软件胎记选取算法,具体包括: 1)借鉴信息检索中文本分类进行特征选取的思想,给出了一种基于互信息的k-gram软件胎记选取算法,构建待保护软件的软件集并以互信息值来度量待保护软件胎记碎片与其类别的相关性,选取高互信息值的胎记碎片组成基准碎片集。算法可有效去除胎记集合中互信息值较低的易受语义保持变换影响的碎片和软件之间的共有碎片等影响胎记性的冗余元素,可有效提升胎记的整体性能。实验结果表明,基准碎片集在胎记碎片数据规模大幅降低的情况下,其鲁棒性、可信性和整体性能较经典k-gram算法有很大提升。 2)考虑到带有功能语义的操作码碎片并非是同一长度的,定长k-gram划分会损失很多不同长度的有价值的胎记碎片。针对该问题,给出了基于变长k-gram胎记选取算法,变长操作码的胎记选取可能更接近于语义分割,同时有效扩充了基准碎片集的数据规模,对软件的描述更加全面。实验结果表明,变长k-gram的基准碎片集在保持原有良好性能的基础上,整体性能较定长的k-gram选取方法有了一定提升。 3)借鉴自然语言处理中多单词词项单元抽取的思想,利用操作码粘性计算和LocalMaxs算法,对一定软件样本空间内对可构成多操作码单元的k-gram碎片进行了评估,使得变长k-gram胎记算法可抽取出更贴近语义的操作码碎片。对基于多操作码单元组成的原始软件集进行了胎记选取,并引入了加权互信息计算方法,实验结果表明,基于LocalMaxs算法多操作码单元的胎记选取算法进一步提升了胎记的鲁棒性。 最后,总结本文工作,并对下一步的研究进行了展望。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分