精细化自动检测篡改区域的数字图像取证方法

时间:2022-10-27 07:51:47

精细化自动检测篡改区域的数字图像取证方法

摘 要: 现存的大部分篡改检测方法对篡改区域的几何变化检测比较敏感,针对该问题,提出一种利用特征图像块精细化自动检测篡改区域的数字图像取证方法,该方法适用于反射、旋转、缩放区域和JPEG压缩定位。首先将重复区域的像素映射到对数极坐标上。然后沿轴,利用反射和旋转产生一维不变描述符。此外,运用每个单独块中提取的特征向量来减少每个阶段的计算时间。最后利用一个精细化阶段复制几何变换后的重复区域。实验对尺寸为24×24和32×32的块进行检测,比较两种情况下获得的定位结果可知,导致较高的真阳性率的测试同时也会导致较低的假阳性。此外,对篡改和未篡改的图像分别进行检测实验,结果表明,与其他算法相比,该算法对几何变换后的图像具有较高的篡改定位准确率和较低的错误匹配率。

关键词: 篡改检测; 几何变换; 精细化; 数字图像; 计算机取证; 一维不变描述符

中图分类号: TN911.73?34; TP391 文献标识码: A 文章编号: 1004?373X(2016)07?0083?06

Abstract: Most of the existing tampering detection methods are sensitive to the geometric transformation detection of the tampering area, for this problem, a digital image forensics method of using feature image blocks to detect the tampering area refinedly and automatically is proposed. This method is suitable for area reflection, rotation and scaling, and JPEG compression and positioning. The pixels of the repeat area are mapped to the log?polar, and then along the axis, the invariant one?dimensional descriptors are generated by reflection and rotation. Each single block is used to extract the feature vectors to reduce the computation time of each stage. After that the repeat area after geometric transformation is copied with a refined stage. The blocks whose size are 24×24 and 32×32 are detected with experiments. The positioning results obtained from the two situation show that the test can lead to high true positive rate while causing low false positive rate. The tampered and non?tampered images were detected with experiments. The experimental results show that, in comparison with other algorithms, the proposed algorithm has high tampering positioning accuracy and low false match rate of the image after geometric transformation.

Keywords: tampering detection; geometric transformation; refinement; digital image; computer forensics; invariant one?dimensional descriptor

0 引 言

现有的数字图像技术提供了复杂的处理工具,这种工具可以产生不易被识别的伪造,一般视觉上很难辨别出图像的异常情况,如果这些被篡改的图像被人们错误使用,将会带来较大的危害[1]。图像篡改检测是一种新兴技术,可以直接通过数据本身对图像的真实性进行检测[2],因此对其进行研究具有很重要的现实意义。

数字图像篡改手段多种多样,其中Copy?Move(复制?移动)是一种简单高效的图像篡改方法[3],即首先从一幅图像中复制部分图像区域,然后将复制区域粘贴到相同图像的其他区域。同时为了掩盖痕迹,篡改者还会在复制粘贴操作后进行加噪、模糊、JPEG压缩以及几何形变处理操作以达到掩盖篡改的痕迹[4]。已有很多研究者对其进行相关研究,一般可以分为变换域[5?6]和非变换域方法[7?10]。

文献[5]将低分辨率小波系数的重叠区域映射到对数极坐标,由此产生的块按字母顺序储存并分析,以识别相近的字母组。在随后的小波分辨率水平中,通过丢弃不满足相近条件的字母方式,迭代过滤成对的字母。文献[6]将重复的像素块映射到来源于傅里叶?梅林变换(FMT)的缩放不变映射符上。然后,将哈希函数应用于每个描述符以确定相同的匹配。然而,这种严格的检测机制使得系统对超过10°的旋转比较敏感。

文献[7]通过相关图来限定副本的区域,并且计算重叠像素块的zernike矩以产生旋转不变特征向量,这种方法按照字母顺序发现潜在的重复。然而,不管是缩放的还是反射的复制图像都不能被这种方法检测出来。文献[8]提出一种不同的方法,即旋转缩放不变描述符通过尺度不变特征转换(SIFT)方式提取。然而,这种算法仅限于寻找近似描述符,且会限定复制检测区域。文献[9]提出一种基于圆谐?傅里叶矩(Radial?Harmonic Fourier Moment,RHFM)的图像篡改检测方法,这种方法对区域旋转和信号处理操作具有一定鲁棒性,然而,其没有对匹配结果进行后处理,检测结果图中含有较多噪声点,且精确度不高。文献[10]利用Krawtchouk矩提取区域块的特征,并按照字典排序,计算矩阵相邻行间的相关系数确定篡改区域,该方法对旋转缩放比较敏感。

本文方法可以检测那些已经经历过几何转换,尤其是反射、旋转和缩放的篡改区域,其中像素的重叠块独立地映射到对数极坐标的一维反射/旋转不变描述符。此外,本文还提出了细化机制来识别那些受几何失真影响的复制块。实验结果也证明了本文方法的有效性。

1 反射、旋转和缩放的问题

2.1 特征提取

本文算法依赖每个块的颜色和亮度分量计算特征向量,该算法的原理是将重复的块被映射到相似的特征向量上。每一个块[Ai]的中心是直径为[q]的圆盘的圆心,[f1i,f2i]和[f3i]分别为圆盘里面红色、蓝色和绿色像素点的平均个数的三个特征量,经实验表明,颜色通道的平均值不会被JPEG压缩和高斯模糊修正[13?14]。

这个过程可以通过穷尽性地比较特征向量[fi]和[L]中其余[m-1]个特征向量实现。然而,在初步搜索阶段,这个过程可以通过按字母排序列表[L]的方式被显著优化,从而让类似的特征向量更接近对方。因此,一旦到达[Vu,]则[Vi]的比较停止,因此有[f1i-f1u>τh。]

设[cir]为计算出的针对[Vi]的较高相关系数。如果[cir]比预定义的相近度阈值[τsim]较大,则偏移量的计算为[xδir=xi-xr,yδir=yi-yr 。]然后,如果[xi

2.3 精细化

在这个阶段,[Q]通常包含许多错误的匹配。例如,图2是伪造中检测出来的所有未定义的匹配(“根源”和“目标”坐标分别被描绘成暗灰色和淡灰色斑点)。由图可观察到,错误的匹配明显渲染了无用的位图。这说明细化机制对生成合理的结果非常重要。

文献[7?8]均假设复制的区域未受到几何变换的影响,如图3(a)所示。当复制图像区域经历了几何扭曲时,将非常严重,这是因为每一个重复块的坐标几乎都被不同的穿线坐标分离,如图3(b)所示。

在接下来的细化机制中,[Q]中的坐标通过给出的相近元组开始检查点集群。为了优化上述过程,[Q]按字母排序与偏移量相近的元组带给每个块,从而减少了需要比较的次数。令[Δ]为下面算法的每次迭代中检测的最大偏移量;系统执行的经验值为[Δ=32。]

步骤1:将偏移量[xδa1,b1]和[yδa1,b1]代到[Q]的元组顶部作为参考,选择所有偏移量范围为[[xδa1,b1-Δ,xδa1,b1+Δ]]和[[yδa1,b1,yδa1,b1+2Δ]]的元组。图2(b)是伪造被相近偏移量分离的斑点对。

步骤2:考虑[F]中只有“根源”坐标,识别尺寸为[ω×ω]的窗口中多于[tmin]个斑点的群集。如果群集的“目标”坐标也形成了尺寸为[w×w]的窗口中多于[tmin]个斑点的包装组,如图2(c)所示,则该群集则是一个有效的复制,且相应的元组被附加到最后一个列表[S。]相反,如果“目标”坐标形成了一个分散点云,如图2(d)所示,则该集群被丢弃。

步骤3:从[Q]中移走[F]中所有的元组,并且当[Q]不是空的时候,重复步骤1~3。最后,位图与[S]中元组中的坐标编码。

用来优化本文方法的操作概括如下:

(1) 丢弃低熵亮度的像素块,从而减少巨大平面像素区(例如天空)典型错误匹配的出现;

(2) 避免计算相互接近的像素块的特征向量距离;

(3) 避免计算耗时的穷举搜索,对颜色/亮度特征向量列表进行排序,以减少搜索阶段需要比较的数量;

(4) 在细化阶段,排序元组列表(例如[Q]),找出偏移相近的块,从而减少需要比较的数量。

3 实验结果与分析

式中:TP是被复制部分的像素点的数目;TN是被当作没有重复部分的像素点的数目;[P]是属于任何重复的像素点的实际数目;[N]是属于没有重复的像素点的实际数目。一个理想的检测将同时出现TPR=1,TNR=1。

3.1 结果评价

利用前面部分讨论的参数设置对尺寸为24×24和32×32的块进行检测;其他参数通过经验参数设置为:[emin=2,τd=40]。实验对象为100张图像,尺寸为400×600,首先分析在非压缩格式和JPEG压缩格式下的原始的、未篡改的图像。表1给出了被误认为包含重复(TNR≠1)的图像个数。与实验尺寸为24×24的块获得的结果相比较,利用尺寸为32×32的块实验时,错误匹配的数目大约降低10%。可得被检测的JPEG压缩格式并没有对错误检测的数目产生重大的影响。

为了评价本文方法的稳定性,本文从每个测试图像随机位置处选择了一个正方形的区域;测试尺寸为80×80和120×120。在被粘到其他随机位置之前,在同一图像中,对该选择区域进行后处理操作。分别测试下面的操作:没有进一步的扭曲(简单的复制粘贴);水射;旋转:5°,20°,40°,80°,100°,140°,160°,175°和180°;缩放因子:0.96,1.03或1.05。因此,每张图像都用来生成36处篡改,每张图像通过本文提出的检测器在非压缩和JPEG压缩格式(质量因子为80和100)中被检测。

利用24×24模块,正确检测到伪造的数目如表2,表3和图4所示。利用32×32模块检测获得的结果如表4,表5和图5所示。大体上,通过本文方法获得的性能在较大的重复情况下较好。然而,对于尺寸为80×80的较小重复,24×24模块的利用会导致错误检测数目的略微增加。

比较利用24×24获得的定位结果和用32×32获得的定位结果,得出导致较高的真阳性率的测试同时也是导致较低的假阳性率的测试。例如:TPR的最高平均值(0.96)是从反射测试中获得的,而140°的旋转测试则获得TPR的最低平均值(0.58)。另一方面,平均TNR从反射中获得,而评估140°的旋转分别为0.98和0.99。

3.2 与其他算法的测试比较

块尺寸设为24×24,将一套尺寸为300×400的自然图像作为检测图像。其中,半数图像用于展示特性,其余半数图像包含相对粗糙结构的大区域。实验平台:2.80 GHz CPU,RAM为2.0 GB的Intel i3双核处理器,仿真平台为Matlab(2011b)。尺寸为300×400的一张图像的分析时间:文献[9]的方法为195 s,文献[8]的方法为5 s,本文的方法为37 s。

3.2.1 对于伪造的图像

首先比较对于伪造图像的检测效果,每次伪造都包含了不同的失真,如图6是旋转30°,缩放1.05的测试结果,图7是水射,缩放0.96的测试结果,图8是旋转15°,水射的测试结果。实际复制区域用白色轮廓表示,灰色区域是检测算法检测出的伪造区域,且灰色区域的尺寸及形状依赖于算法本身。对于图6~图8,文献[8]的算法只有图6和图7较为清楚地检测出,文献[9]的算法几乎没有给出准确的检测,本文方法在三个图像均能大概检测出伪造位置。从这3幅小尺寸图像可以得出平均TPR和平均TNR分别为:应用文献[9]方法,TPR=0.29,TNR=0.98;应用文献[8]方法,TPR=0.48,TNR=0.94;应用本文的方法,TPR=0.79,TNR=0.18。

3.2.2 对于未篡改图像

本文中的20张未篡改的检测图像均利用上述三种方法进行分析。这20张图像中,被误认为是伪造的图像数目如表6所示。不同于其他两种方法,本文方法设法正确地验证所有包含对称结构的图像,如图9所示,图9(a)包含大量的纹理和图案,图9(b)具有大面积光滑的区域,从检测结果可以看出,本文方法不能验证包含大面积光滑区域的图像。然而,文献[8]和文献[9]在这方面稍微好点,不过依然有一些区域被这两个算法误认为伪造区域。图9(a)充分说明了本文算法对于复杂纹理的图像检测效果比较好,优于其他两种算法,这充分说明了精细化过程的作用。

4 结 论

本文提出了一种新的自动定位重复区域的数字图像取证方法,可有效检测和定位JPEG压缩。本文方法的主要创新点总结如下:将像素点的重叠块映射到对数极坐标图的一维描述符上,可有效地执行搜索;从每个单独块中提取的特征向量,减少了每个阶段的计算时间;提出了一个细化阶段来复制经历过几何变换的重复区域。实验结果表明,综合考虑检测/准确定位和计算花费,本文方法优于其他方法。

作为现有的图像取证方法,本文的结果仍需要一些限制性的条件。未来主要是将细化机理作为减少错误报警的方法进行深入研究。

参考文献

[1] 周琳娜.数字图像取证技术[M].北京:北京邮电大学出版社,2008.

[2] 邵虹,朱虹,崔文成.抗翻转、旋转和缩放攻击的图像区域复制篡改检测[J].计算机辅助设计与图形学学报,2015,27(1):157?165.

[3] 朱艳玲.数字图像取证的关键技术研究[D].北京:北京邮电大学,2011.

[4] BRAVO?SOLORIO S, NANDI A K. Automated detection and localisation of duplicated regions affected by reflection, rotation and scaling in image forensics [J]. Signal processing, 2011, 91(8): 1759?1770.

[5] MYMA A N, VENKATESHMURTHY M G, PATIL C G. Detection of region duplication forgery in digital images using wavelets and log?polar mapping [C]// Proceedings of 2007 International Conference on Computational Intelligence and Multimedia Applications. SIVAKASI: IEEE, 2007: 371?377.

[6] 吕占伟,邓传加.傅里叶?梅林变换(FMT)在畸变?不变图像识别中的应用[J].应用光学,2009,30(5):783?786.

[7] PAN X Y, LYU S W. Detecting image region duplication using SIFT features [C]// Proceedings of 2010 ICASSP?IEEE International Conference on Acoustics Speech and Signal Processing. Dallas: IEEE, 2010: 1706?1709.

[8] PANDEY R C, SINGH S K, SHUKLA K K, et al. Fast and robust passive copy?move forgery detection using SURF and SIFT image features [C]// Proceedings of 2014 IEEE International Conference on Industrial and Information Systems. [S.l.]: IEEE, 2014: 1?6.

[9] 秦娟,李峰,向凌云,等.采用圆谐?傅里叶矩的图像区域复制粘贴篡改检测[J].中国图象图形学报,2013,18(8):919?923.

[10] IMAMOGLU M B, ULUTAS G, ULUTAS M. Detection of copy?move forgery using Krawtchouk moment [C]// Proceedings of 2013 8th International Conference on Electrical and Electronics Engineering. Bursa: IEEE, 2013: 311?314.

[11] DURAND F, DORSEY J. Fast bilateral filtering for the display of high dynamic range images [J]. Proceedings of SIGGRAPH, 2002, 21(3): 257?266.

[12] 孙抗,汪渤,周志强,等.基于双边滤波的实时图像去雾技术研究[J].北京理工大学学报,2011,31(7):810?813.

[13] 关华.数字图像来源检测的鲁棒性和安全性问题研究[D].广州:华南理工大学,2014.

[14] SHIVAKUMAR B L, BABOO S. Detection of region duplication forgery in digital images using SURF [J]. International journal of computer science issues, 2011, 8(4): 859?865.

[15] LIN C Y, WU M, BLOOM J A, et al. Rotation, scale and translation resilient watermarking for images [J]. IEEE tran?sactions on image processing, 2001, 10(5): 767?782.

上一篇:例谈“数学日记”在初中数学教学中的应用 下一篇:一种电网规划方案决策的灵敏度分析算法