基于频域的数字音频水印算法研究
作者单位:太原理工大学
学位级别:硕士
导师姓名:马建芬;周鹏
授予年度:2021年
学科分类:08[工学] 0839[工学-网络空间安全] 081201[工学-计算机系统结构] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:音频水印 秘密共享 平稳小波变换 浊音 零水印 谐波噪声模型
摘 要:在音频信号中嵌入所有者的有效版权信息的技术称为数字音频水印技术,这种技术可以有效的解决数字音频的版权问题,已经成为信息安全领域内的重要研究之一。而且同步问题对于音频信号的研究十分重要,所以音频水印技术的发展较慢;随着互联网技术的不断发展,大量出现的各种各样的破解工具导致了数字音频的被侵权问题越来越严重,如今对音频水印算法的性能也就有了更高的要求。但是,由于音乐音频类型的多样性,对于现有的基于频域的音频水印算法使用不同变换进行级联的方式实现水印信息的嵌入,并不能保证同时适用于大部分类型的音乐音频,没有良好的泛化能力。所以,本文针对传统的基于频域的音频水印算法进行了研究和改进。主要从两个方面进行研究与总结,一方面针对的是传统嵌入式音频水印算法,一方面则针对“非嵌入式,即传统音频零水印算法。具体内容如下:(1)首先通过查阅文献、整理资料,介绍了关于音频信号(包括了语音信号)的内容,并对音频水印领域的经典论文和前沿论文进行了仔细研读,系统总结了音频水印技术相关的知识。介绍了一些经典的音频水印算法的原理,其中对基于频域的音频水印算法进行了详细的介绍,分析了不同方法的优势和缺点,针对存在的问题提出相应的优化思路。(2)在传统的嵌入式音频水印算法中,并没有有效解决不可感知性,有效载荷和鲁棒性这三者的权衡问题,同时,水印信息表现出了弱安全性,针对这两个问题,本文提出了一种基于秘密分享和平稳小波变换(SWT)的数字音频水印算法。首先,利用了Shamir的秘密共享方案对水印信息处理得到n份秘密信息,其中n-1份存储在区块链中,剩余一份嵌入到根据水印信息特征产生出的哈希码选定的浊音帧中。在频域内,通过SWT和Schur分解(SD)来修正浊音帧的离散余弦变换(DCT)系数,将水印自适应地嵌入到从SD获得的正交矩阵的第一列元素中。实验结果表明,提出的改进算法具有较高的不可感知性,对各种信号攻击有着很高的鲁棒性,有效载荷高达1.39kbps。(3)为了使得零水印的构造时选取的音频特征更具有代表性,并去除伴奏参与特征的提取过程,本文又提出一种基于支持向量机(SVM)和谐波特征结合的鲁棒音频零水印算法。首先将原始音频中的语音通过谐波噪声模型(HNM)建模后获取到谐波部分后,在利用K-means聚类算法获得每帧谐波部分的高通SWT子带的大幅值区域来构造零水印,通过大幅值区域确定的奇异值均值集合作为SVM样本集,进行SVM训练,从而生成决策函数。水印检测方式为盲检测,指的是利用构造零水印阶段得到的决策函数来进行检测。实验结果表明,该算法对于不同类型的音频来说都表现出很强的抗攻击效果。