MPEG-4自适应视频水印算法

时间:2022-09-12 09:58:58

MPEG-4自适应视频水印算法

摘 要:为了更好地保证水印的鲁棒性和不可感知性,结合mpeg-4视频压缩原理以及人类视觉模型系统,提出一种自适应视频水印算法。根据I帧图像离散余弦变换(DCT)后的直流系数(DC)以及中低频系数个数,设计自适应因子,对不同的图像块采用不同的嵌入强度,将水印嵌入到DCT变换后的低频系数中。实验证明,该算法能够很好地与人类视觉系统相适应,并对常见的攻击有很强的鲁棒性。

关键词: 视觉系统模型; 离散余弦变换; 自适应因子; 视频水印算法

中图分类号:TP391 文献标识码:A

文章编号:1004-373X(2010)10-0099-03

Adaptive Video Watermarking Algorithm Based on MPEG-4 Streams

QU Yun-hui

(Computer Teaching Office of Public Department, Xi’an Medical College, Xi’an 710021, China)

Abstract: A self-adaptive video watermarking algorithm is proposed based on MPEG-4 video compression principle and the human visual system model, to ensure the robustness and invisibility. The adaptive factor is designed according to the direct current coefficient and the number of low and intermediate frequency coefficients after discrete cosine transform (DCT) of I frame. The different embedded strength is used for different image blocks to embed the watermark into the low frequency coefficients. The experiments show that the algorithm is compatible with the human visual system, and is very robust to the common attack.

Keywords: human visual system model; discrete cosine transform; adaptive factor; video watermarking algorithm

近年来,随着互联网和多媒体信息处理技术的迅猛发展,网上多媒体信息(图像、视频、音频、文本等)的免费获取,复制,分发,传送,修改等已经变得极为快捷,方便。然而,网络给人们带来便利的同时也暴露了许多安全问题。如何防止非法复制,有效地保护版权已经成为迫切的问题。数字水印技术[1]作为该问题的重要解决方法,已经从图像领域发展到音频、视频和文本等领域。由于大量数字视频唱片的出现,使得对视频数字产品版权保护的市场需求日益迫切,因而视频数字水印技术也成为当前水印研究的热点[2-3]。

视频水印方法主要有2种:空间域方法和变换域方法。与空间域方法相比,变换域,尤其是离散余弦变换(DCT)域上的水印方法主要有以下优点:在变换域中可有效地利用人类视觉系统的特征;可与估计数据压缩标准(如MPEG等)兼容[4];在DCT域实现的水印算法,计算复杂性往往较低。典型的DCT域的水印方法是文献[5]提出的基于DCT域扩频水印技术,把满足整体分布的伪随机序列嵌入到有限个幅度较高的DCT系数上,其主要缺点是恢复水印必须要有原始图像的参与,并且水印的嵌入没有很好地与人的视觉特征相联系。文献[6]算法中宏块的选择虽然是基于视觉特征的,但这些宏块被限制于规则的瓦片模式;文献[7]提出以纹理、亮度和相邻帧变化为特征的视频水印嵌入,但是它只通过简单地统计高低纹理场景以及变动较小场景的数目,并单独计算亮度特征,来获得高(低)纹理特征,其水印嵌入采用统一的嵌入强度,与具体子块特征无关。

为了更好地与人类视觉系统相结合,在此提出自适应的视频水印算法。根据人类视觉系统模型的对比特性,结合DCT变换后的直流系数与中低频系数的个数,设计自适应调节因子,对不同的图像块采用不同的嵌入强度。为了进一步保证水印的鲁棒性,在水印嵌入之前,先利用Hybird映射对水印序列进行了置乱。

1 自适应调节因子

由人类视觉系统模型(HVS)的对比特性可知,纹理越复杂,人类视觉失真越小,即视觉失真门限越高[8],在不考虑背景照度的情况下,在受纹理屏蔽的影响下,图像纹理复杂丰富的区域能够增强水印的嵌入强度,而图像平滑或纹理简单的区域水印的嵌入强度应该降低,并且背景越亮,照度阈值越高。

对于MPEG-4视频图像的I帧进行部分解码,得到I帧图像块的DCT系数,并用量化表对其系数进行量化。由图像的相关知识可知,量化后非零的中频系数个数越大,图像的高频成份越丰富,纹理越复杂。故本文以量化后的中低频系数的个数和直流系数为参数,设计了自适应调节因子。

对I帧部分解码后的到的图像进行分块,使每一块的大小为8×8。对每一个8×8的图像块做离散余弦变换(DCT),并用量化表对其进行量化,得到图像块的中低频系数的个数s及量化后的直流系数DC。由于在总体分布未知,或者数据严重偏态,有若干异常值(极端值)等异常情况下,数据均值,标准方差都缺乏稳健性,故本文用三均值和四分位标准差代替均值和标准方差来设计自适应调节因子如下:

α=0.5e-k[┆DC^/DC]r[s^-s/σ^s]c, s-s^>0

1-0.5e-k[DC/DC^]r[s-s^/s]c,s-s^≥0(1)

式中,,DC^分别为s,DC的三均值;s为s的四分位标准差。

2 水印嵌入算法

2.1 水印序列的预处理

为了增强安全性和鲁棒性,水印序列嵌入之前要进行预处理,采用置乱的方法实现水印的加密调制,消除水印序列之间的相关性。算法中采用Hybird映射对水印序列进行置乱。Hybird映射方法比较其他方法复杂,但是其安全性高,不易被攻击。式(2)给出了Hybird映射的表述:

xk+1=b(1-u1x2k),-1

利用式(2)得到(0,1)上的伪随机序列{xk},k=0,1,2,…。在本文中,取u1=1.8,u2=2.0,b=0.85,此时映射处于混沌状态。然后将伪随机序列{xk},k=0,1,2,…,代入式(3),对其进行二值化:

x*k=0,|xk|

1,|xk|≥0.5,k=1,2,…(3)

此时,二值序列{x*k,k=0,1,2,…}保持了混沌序列易于生成,数量多以及对初始条件敏感等优良特性。

将该混沌序列与原始二值水印序列wk按位异或,就形成了最终的水印信号w*k。其中Hybird映射的初值u1,u2,b可以作为水印算法的3个密钥k1,k2,k3。

2.2 水印的嵌入算法

为了保证水印的鲁棒性,同时满足视频水印的不可感知性,本文选择DCT变换后的低频系数进行水印的嵌入。将上面得到的水印序列按照以下步骤自适应的嵌入到MPEG-4视频码流中:

(1) 对MPEG-4视频码流进行部分解码得到I帧图像的DCT系数矩阵,对其进行8×8分块,得到子块图像的DCT变换矩阵I。使用量化矩阵Q′对变换矩螵I的中低频系数和直流系数量化,按照之字型扫描统计非零的中低频系数,得到量化后的中低频系数的个数┆s和直流系数DC,计算其三均值,DC^和四分位标准方差S,利用式(1)计算调节因子α。

(2) 利用公式Qnew=λ•α生成新的量化矩阵,其中λ是水印嵌入的强度。

(3) 根据式(4),将水印序列嵌入到DCT变换后的低频系数中。

I(x,y)′=round(I(x,y)/Q┆new)•Q┆new, W=0

round(I(x,y)/Q┆new]•Q┆new+

sign(I(x,y))•Q┆new/2, W=1

(4)

式中:I′是加过水印后的变换矩阵;round()是取整运算,取最接近的整数;sign()是符号函数。

水印的嵌入位置是在低频位置(0,1)和(1,0)中随机选择一个位置加入水印,并且这两个位置不参与中低频个数的统计。

(4) 用I′代替原I帧的变换矩阵I,对其进行反离散余弦变换(IDCT),并将其写入到视频码流中,即得到嵌入水印后的MPEG-4视频码流。

3 水印提取算法

水印的提取不需要原始视频码流,所以是盲提取。水印的提取步骤如下:

(1) 对嵌入水印后的视频码流进行部分解码,得到I帧加水印序列。将I帧加过水印的图像矩阵分成大小为8×8的块,得到图像子块的变换矩阵I′,用量化矩阵对变换矩阵I′的中低频系数量化,然后按照之字型扫描统计非零的中低频系数,得到中低频系数个数s′,计算三均值′,四分位差s′。利用式(1)计算调节因子α′。

(2) 利用公式Q┆new=λ•α′生成新的量化矩阵。

(3) 利用式(5)提取加密后的水印:

W′=0, abs(I(x,y)′-round(I(x,y)′/Q┆new′)•

Q┆new′)

1,otherwise(5)

式中:τ为阈值;abs()为绝对值函数。

(4) 利用假设检验来判定水印是否存在。相关性公式如下:

ρWW′=Cov(W,W′)/[D(W)D(W′)](6)

式中:ρWW′,Cov(W,W′)分别为原始水印W和提取出的水印W′相关系数和协方差;D(W)与D(W′)分别为原始水印W和提取水印W′的方差。若ρWW′>T,则有水印存在;否则无水印。阈值T的选取由实验确定。

对提取出的水印进行整合,并进行反置乱,即得到提取出的水印序列。

4 实验结果分析

以靳济芳和钟玉琢等给出的MPEG-4编解码模型为基础[9-10],用VC++6.0编程实现本文所提出的算法。采用经过MPEG-4编码器编码后的Foreman和Stefan视频序列作为测试视频,进行水印序列的嵌入,并采用相应的解码器对视频进行部分解码。其中Foreman,Stefan的帧大小均为255×288,视频长度分别为100帧和90帧。

实验中,取c=2,k=2,对视频Foreman和视频Stefan,平均嵌入强度分别为α=4.936和α=5.423。对两段视频,分别采取固定嵌入强度α=5.423,┆α=4.936以及自适应调节α来进行水印嵌入。

限于篇幅,仅列出Stefan视频帧。从图1可以看出,采用自适应调节因子嵌入水印后,从视觉上看,视频帧图像在色彩等方面更加接近于原始视频。在Stefan视频中,由于草地部分色调单一,故嵌入强度较低,而┩1(c)中采用固定强度嵌入水印的,每一部分嵌入强度相同,所以视频帧的草地部分较原始图像有了明显变化。而采用自适应嵌入后的视频更接近于原始视频。

图1 Stefan 视频帧对比

本文通过计算峰值信噪比(PSNR)来客观的判断不可感知性,PSNR的计算公式如下:

PSNR=10lg(2552/MSE)(7)

式中:MSE是均方误差,MSE的值越小,表明图像质量改变越小。MSE的计算公式如下:

MSE=1M×N∑Mi=1∑Nj=1|I(i,j)-I′(i,j)|2(8)

式中:I是原始视频数据,I′是嵌入水印后的视频数据,M,N分别为该帧图像的高和宽。

分别计算采用固定强度嵌入以及采用自适应调节强度嵌入后的Forman视频与Stefan 视频的PSNR值,对比如表1所示。

表1 PSNR对比

ForemanStefan

α=5.423自适应调节α=4.936自适应调节

第1帧PSNR40.69240.69240.70040.700

第15帧PSNR35.90336.44330.98932.409

第38帧PSNR36.14436.32531.70031.725

第55帧PSNR33.56634.93329.42230.883

第70帧PSNR36.00935.53530.35431.536

第90帧PSNR33.49534.27330.63730.665

平均PSNR值33.74835.46230.36831.782

从表1看出,虽然在某些帧,采用固定嵌入强度得到的PSNR值并不比采用自适应调节得到的PSNR值差,但是就平均PSNR值而言,采用自适应调节因子后,效果明显提高。

5 结 语

本文在分析人类视觉系统模型的基础上,提出了基于MPEG-4码流的自适应视频水印算法,根据量化后的直流系数与中低频系数的个数,设计自适应调节因子,对不同的图像块采用不同的嵌入强度。同时考虑了对水印的处理技术,使用Hybird映射对水印序列进行了预处理。将处理后的水印序列嵌入到MPEG-4视频码流的I帧DCT变换后的低频系数中。从实验结果可以看出,该算法能够很好的与人类视觉系统相适应,并对常见的攻击有很强的鲁棒性。

今后的工作重点是结合视频运动的特点,进一步改进自适应调节因子,使其更好的符合人类视觉系统特性,在满足不可感知的前提下,尽可能地增强水印的嵌入量和嵌入强度。

参考文献

[1]VOYATZIS G, PITAS I. The use of watermarking in the protection of digital multimedia products[J]. Proceedings of IEEE, 1999, 87(7): 1197-1207.

[2]ENGGERS J J, GIROD B. Blind watermarking applied to image authentication[C]//Proceedings of International Conference on Acoustics, Speech and Signal Processing 01. Salt Lake City: IEEE Computer Press, 2001:1-4.

[3]SWANSON M D, TEWFIK A H. Multimedia data embedding and watermarking technologies[J]. Proceedings of the IEEE, 1998, 86(6): 1064-1087.

[4]DAI Yuan-jun, ZHANG Li-he, YANG Yi-xian. A New method of MPEG video watermarking technology[C]//Proceedings of ICCT.[S.l.]: [s.n.], 2003: 1845-1847.

[5]COX I J, KILIAN J, LEIGHTON T, et al. Secure spread spectrum watermarking for multimedia[J]. IEEE Trans. Image Processing, 1997, 6(12): 1673-1687.

[6]DARMSTAEDTER V, DELAIGLE J F, NICHOLSON D, et al. A block based watermarking technique for MPEG-2 signals: Optimization and validation on real digital TV distribution links[C]//Proceedings of European Conference on Multimedia Applications, Services and Techniques. Berlin:[s.n.], 1998: 190-206.

[7]AGUNG I W, SWEENEY P. Video scene characteristic detection to improve digital watermarking transparency[J]. IEEE Proceedings Vision, Image and Signal Processing, 2004, 151(2): 146-152.

[8]JAYAN N, JOHNSTON J, SAFRANEK R. Signal compression based on models of human perception[J]. Proceeding of the IEEE, 1993, 81(10): 1385-1422.

[9]靳济芳.Visual C++小波变换技术与工程实践[M].北京:人民邮电出版社,2004.

[10]钟玉琢,王琪,贺玉文.基于对象的多媒体数据压缩编码国际标准MPEG-4及其校验模型[M].北京:科学出版社,2007.

上一篇:基于谐波平衡法的射频功率放大器分析与仿真 下一篇:几种混沌序列生成器的比较分析