一种基于混沌调制和双变换域的音频水印算法

时间:2022-09-24 09:57:55

一种基于混沌调制和双变换域的音频水印算法

摘要:针对传统音频水印算法不能实现盲提取和水印的安全性、鲁棒性不强,提出一种改进算法。采用Logistic混沌序列对降维后的水印信号作进行调制,再结合离散小波变换的多层分辨能力和离散余弦变换的能量汇聚特性,通过修改双变换域的中低频系数,在载体音频中嵌入水印信息。仿真实验表明改进算法具有更好的安全性和鲁棒性。

关键词:音频水印;离散小波变换;离散余弦变换;混沌调制;双变换域

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2014)08-1783-04

随着全球互联网与数字化多媒体技术的飞速发展和广泛普及,人们逐渐习惯从网络上汲取所需信息。但对网络多媒体数据的随意下载、篡改和传播,使多媒体数据的盗版问题日益突出。针对图形图像、音频和视频等多媒体数据的版权保护和安全认证等问题,研究人员提出一种有效的保护手段――数字水印技术。作为信息安全的研究热点之一,它能有效地抑制多媒体数据的侵权问题,维护版权人的合法权益。

目前,图像和视频水印技术的研究相对普遍,但是由于人类听觉系统的敏感性使音频水印的实现较为困难。文献一[1]提出的加性嵌入算法,操作简单,但不能实现盲检测;文献二 [2]的算法综合了离散小波变换(Discrete Wavelet Transform,DWT)和离散余弦变换(Discrete Cosine Transform,DCT)的优点[3],鲁棒性较好,但水印加密比较简单。文献三[4]的算法提供了水印加密的新思路,但没有吸收小波变换的优点。该文在分析和研究上述算法的基础上,提出基于混沌调制和双变换域的鲁棒性水印算法。文章采用一幅二值图像作为水印,利用Logistic混沌加密和双变换域嵌入水印信息,有效吸收了各算法的优点。

1 音频数字水印方案

算法采用Logistic混沌序列调制降维后的水印信号,然后对含水印音频作三层DWT,分别得到对应的高频分量(cAi,i=1,2,3)和低频分量(cDj,j=1,2,3)。因为音频的大部分能量都集中在三层小波变换域的低频分量中,所以对低频分量以一定的量化单位进行分段处理后,把每一段分别进行DCT。最后把调制后的水印信息嵌入到DCT域的中频分量上[5]。根据人耳的听觉特性,嵌入在混合域低频分量上的水印信息具有较好的不可感知性。水印提取过程是水印嵌入的逆过程,水印提取时不需要原始音频参与,实现了水印的盲提取。

1.1 水印预处理

水印选择的是二维图像,而原始音频是一维信号,所以水印嵌入之前需要先降维和加密。

1.1.1 水印选取和降维

水印选取一幅形如“ AUST”字样的二值图像,像素大小为[64×64],具有特殊的意义。如图1。

由于人眼的分辨率和图像的关联特性[6],用它做水印的鲁棒性效果要远远好于序列号。二值水印图像只包含(0,1)信息,所以水印信息可以表示为:

[Y=y(i,j),1≤i≤A,1≤j≤B,y(i,j)∈0,1] (1)

降维操作后:

[Y′=y(k)=y(i,j),k=i*B+j,1≤j≤B,1≤i≤A,y(i,j)∈(0,1)] (2)

上式中,A=B=64。原始音频的信号长度要大于[Y′]的长度才能保证水印的正常嵌入。

1.1.2 水印的混沌调制

采用Logistic混沌序列对降维后的音频信号进行调制。设置Logistic序列的初值[x0]和参数[λ]得到序列[L(k)]。然后利用已经二值化的[L(k)]序列和水印序列[y(k)]进行调制,得到置乱之后的水印[Lw(w)]:

[Lw(k)=y(k)L(k)] (3)

混沌调制后的水印如下:

Logistic序列混沌调制,毫无规律性。把Logistic序列的初值[x0]、参数[λ]和A(或B)作为音频水印系统的密钥保存[7]。

1.2 音频预处理

对原始音频信号进行分段处理不仅能减小计算的复杂度,而且能避免裁剪攻击带来的误差扩散。设分割后的每段小音频M,设它的长度为L,表示为:

[M=M(n),n∈1,L] (4)

把[M]分为与音频水印嵌入相关的部分[McA]和水印嵌入不相关的部分[McD]即:

[M=McA+McD] (5)

这样在嵌入时我们只考虑与水印嵌入有关的部分,从而提高了算法效率。

1.3 水印嵌入

水印信号经过Logistic混沌序列调制(异或操作),完成加密。将原始音频预处理后进行三层DWT,得到分解系数cA3、cD3、cD2和cD1。分解后的音频能量大部分集中在低频分量上,把低频系数cA3分成长度为8的数据子段,再分别对每一个子段做DCT。由于DCT的能量汇聚特性,原DWT域的低频分量的能量主要集中在DCT域的中低频分量上[8]。选择双变换域的中频系数(即每个数据子段的第4个系数)作为嵌入位置。对选择的嵌入系数做定量S的余数运算,结果赋给Z1;系数修改按下面的公式执行:

1.4 水印提取

水印的提取是水印嵌入的逆过程。算法的水印提取步骤如下:1)将被检测的音频信号分段,其次对含水印的音频信号进行三层离散小波变换。得到第三层分解系数cA3、cD3、cD2、cD1。2)将低频系数cA3作水印嵌入时的相同分段,再进行离散余弦变换。对含有水印的嵌入系数做S的余数运算,结果赋值给[Z2],如下所示:

其中[W′]就是所要提取的水印信息。3)根据密钥和混沌序列对水印信息[W′]进行混沌解调(异或操作),得到水印信息的一维序列[W],再对其升维得到原始的二维水印图像[w]:

2 实验仿真和分析

实验在含奔腾四CPU、Windows 7的操作系统、Matlab 7.0软件的联想PC机上进行。载体音频选自流行歌曲“稳稳的幸福.wav”中的一段音频。水印选择图1所示的二值图像,像素大小为[64×64]。载体音频是长度为20S,量化精度为16bit,采样频率为44100Hz,采样点数为876697的单声道音乐(未压缩状态下)。实验选择db4作为DWT的小波基函数,用初值[x0=0.2]和参数[λ=3.6]生成Logistic混沌序列对版权水印加密,并把像素[A]、初值[x0]和参数[λ]一起作为系统密钥保存。原始音频的波形图如下:

2.1 不可听性测试

在无攻击的情况下,含水印水印的信噪比为[snr=28.4916],满足水印系统信噪比不小于20db的透明性要求。

对比图5和图6的波形图几乎没有变化,差别明显的地方音频信号的能量都相对较大,由于人耳的听觉特性,这部分差别几乎不能被感知出来。选择一组听众试听,听众感觉不到音频水印嵌入前后的差异,表明它的可听性良好。

2.2 安全性能测试

音频水印系统的安全性通过Logistic混沌序列调制和密钥来保证。密钥包括三部分:混沌序列的初值[x0]、参数[λ]和水印的像素大小[A]。

2.3 鲁棒性能测试

为了检验水印的鲁棒性,对水印进行如下攻击:1)低通滤波攻击:采用10阶,截止频率是10KHz的巴特沃斯滤波器滤波;2)加噪攻击:对嵌入水印的音频上加上一个均值为0,均方差是0.08的高斯白噪声;3)上采样攻击:把原始音频信号的采样频率提升一倍,再利用抽值技术恢复成原频率44.1KHz;4)重新量化攻击:把音频信号的量化精度从16比特降到8比特,再重新升至16比特;5)有损压缩攻击:将含水印音频mp3压缩至64kbps的码率;6)裁减攻击:随机裁剪掉含水印音频中的50个样本点。实验结果如下:

从表1可以看出,相同条件下本文算法NC值和PSNR值要大于文献算法;并且除裁剪攻击外,该文算法的NC大多接近于1,说明其鲁棒性能更好。

3 结论

本是在文献一算法的基础上提出一种改进算法,算法用Logistic混沌序列调制水印信息,并结合DWT的多层分辨和DCT的能量汇聚的优点,通过修改双变换域的中频系数,实现水印嵌入。仿真实验证明算法具有良好的不可听性,在相同实验环境下比文献算法的安全性和鲁棒性更好。该文是通过修改双变换域的中频系数完成水印嵌入的,下一步将研究水印在双变换域的自适应嵌入算法。

参考文献:

[1] 赵勇,夏薇,周卫红.一种基于DWT的数字音频水印算法[J].云南民族大学学报:自然科学版,2012,21(3): 207-210.

[2] 陈雪松,高畅.基于DCT和DWT的音频水印算法[J].计算机安全,2009(12): 48-50.

[3] 张金全,王宏霞.DCT和DWT 域音频水印幅值变化规律分析[J].电子学报,2013(6):1193-1194.

[4] 彭川,莫海芳.基于Logistic混沌序列的鲁棒数字水印方案[J].计算机仿真,2012,29(9):278-280.

[5] 宁国强,刘媛媛,李凤堂.一种基于DWT-DCT变换强鲁棒性的数字水印算法[J].电子设计与工程,2009,17(11): 67-69.

[6] 廉蔺,李国辉,王海涛.基于MSER的红外与可见光图像关联特征提取算法[J].电子与信息学报,2011,33(7):1625-1627.

[7] 王育民,郑建伟.通讯网的安全一理论与技术[M].西安:西安电子科技大学出版社,1999:178-180.

[8] 马翼平,韩纪庆.DCT域音频水印:嵌入对策和算法[J].电子学报,2006(7):1260-1263.

上一篇:基于工作过程的高职计算机专业实训教学研究 下一篇:“可以穿戴”到“愿意穿戴” 还有多远