MP3编解码对音频水印信号影响的研究

时间:2022-09-23 01:35:16

MP3编解码对音频水印信号影响的研究

摘 要 MP3已经成为数字音频的主流压缩编码。本文从实验出发探讨了MP3编解码对时域和频域两方面影响,重点分析MP3编解码对水印信号的影响,基于此得出针对时域变化采用载体信号和重采样划分来实现嵌入与提取同步,通过量化相邻子帧低频能量比来嵌入信息以消除频域失真。

关键词 MP3 音频水印 同步机制

中图分类:TP393 文献标识码:A

0引言

随着数字音频技术的发展,水印技术得到越来越多的研究与关注。由于人类听觉系统(HAS)极为灵敏,音频感知冗余较小,水印同时满足隐蔽性和鲁棒性条件的困难较大,音频水印的研究相比较于图像水印更具有挑战性。

1MP3音频水印

现有MP3音频水印算法大致可以分为两类:一类为压缩中和压缩后嵌入,其实质是通过修改MP3的编码中的感知非敏感信息来嵌入秘密信息,可以获得较好隐蔽性和较大的嵌入容量,MP3Stego隐写工具就采用了这种方法但是这类算法只是“躲过”了有损压缩,本身并不能抵抗MP3压缩算法。另一类为压缩前嵌入,一般通过修改频域嵌入来获得较好的鲁棒性。此类算法都缺乏变采样率MP3编解码测试,对MP3攻击的测试也较简单,码率设置较高,压缩比较低,或者不说明压缩参数,无法证明其同样适用于高压缩比的MP3编码;且水印算法设计仅考虑了有损压缩带来的波形失真,嵌入与提取缺乏相应的同步机制虽然在音频水印系统中引入了同步信号,缺点是所用的算法对音频能量幅度的变化非常敏感,不适合压缩编码。本文采用多种MP3工具分析了编解码后信号时域和频域的变化,根据编解码前后低频能量的稳定性,通过量化相邻子帧低频能量之比比较对水印信息的影响,然后对每一帧进行了不可感知性评价。

2MP3编解码对音频信号的影响

原始音频信号经过MP3编解码后在时域和频域都发生了改变,时域变化主要受编码器影响,频域失真则与压缩采用的码率和采样频率有关。实验用原始音频都为从CD抓取的wav格式音频,44.1kHz采样频率f下文中如不特别声明,原始信号采样频率默认为44.1kHz),16bit精度,MP3工具包括了Co0ledit2000Pro,iTunes,MP3 Audio Converter,Win amp Prov5.34。

2.1时域变化

任意截取长度为0.5s的原始音频片段用Cooledit2000Pro经过128kbps,44.1kHz的MP3编解码后音频时长从O.58变为0.574s,前面增加1635个样点。这些增加的样点大部分为零值点,少量为头尾帧边缘效应数据。MP3编码时采用的MDCT为正交重叠变换,头尾帧变换时需补零,从而产生边缘效应,MP3编解码后这部分数据也被加到音频中。这里把前后增加的样点分别称为前边缘信号和后边缘信号,而把中间的样点称为有效信号。前边缘信号长度与后边缘信号大致相等,边缘信号长度与MP3编码器有关,是不同的MP3编解码工具音频的前边缘信号样点个数。经过MP3编解码后进行水印提取时,由于边缘信号的加入,嵌入位置在时域上已经改变,须要进行重定位。若有效信号本身的开始或者结尾就为一系列零值样点,那么经过MP3编解码后这些有效信号的零值样点会与边缘信号混淆,更难确定时域的提取起始点。

2.2频域失真

MP3编码是一种有损压缩,将每帧样点分为等宽子带,每个子带根据心理声学模型计算信掩比,再根据编码码率进行比特分配,得到量化因子,最后对MDCT系数进行量化和Huffman编码。若进行变采样率MP3压缩,还会对信号进行减采样。MP3编码主要是利用声音的频域掩蔽效应,使量化噪声处于频域的掩蔽阈值之下,去除了音频中的感知冗余成分,包括一些能量很小的频率成分。低频(10kHz)部分能量很小,可感知的频率分量也相对较少,虽然掩蔽阈值较小,但信掩比相对较小,高频能量经过MP3编解码后失真较大。如果采用变采样率MP3编解码,随着采样频率的降低,高频部分损失会进一步增大。随着编码码率和采样频率的降低,压缩比增大,高频能量失真幅度也显著增大,而低频能量失真很小且几乎稳定。由此可见,经MP3编解码后,10k以上频率能量变化幅度最大可达到33.24%,而3kHz以下频率能量变化幅度最大只有4.19%。更多实验显示,若音频信号本身能量较大且高频成分丰富,例如~段节奏很快的摇滚乐,经MP3编码后,10kHz以上频率能量变化幅度最大可以超过90%,而3kHz以下频率能量变化幅度仍然不超过4%。故音频的低频能量对MP3编解码具有很好的鲁棒性。

3结束语

本文主要分析了MP3编解码对于水印的影响,通过分析如果在原始音频中嵌入水印再编码,这种水印在采样和量化环节的失真比较严重,故在低频中嵌入水印有更好的鲁棒性。

参考文献

[1] Katzenbeisser S,Fabien A Petit colas P编,吴秋新,钮心忻,杨义先,罗守山,杨晓兵译,信息隐藏技术―― 隐写术与数字水印.北京:人民邮电出版社,2001:104―105.

[2] 刘伟,王朔中,张新鹏一种基于部分mp3编码原理的音频水印.中山大学学报(自然科学版),2004年,43增刊(2):26―33.

[3] 项世军,黄继武,王永雄.一种抗AD/DA变换的音频水印算法.计算机学报,2006年,29(2):308―316

上一篇:铁路运输统计分析系统的设计与实现 下一篇:计算机数据库的管理与应用