基于图像感知哈希的运动目标跟踪

时间:2022-09-01 10:09:08

基于图像感知哈希的运动目标跟踪

摘要:运动目标跟踪目前已经成为计算机视觉领域的重要研究课题之一。目标跟踪的性能受到众多因素的影响,有研究表明,选取合适的目标表示模型作为特征进行跟踪可以大幅度提升跟踪效果。现有的很多特征或计算复杂,或者需要大量的数据进行训练,或缺乏对目标外观变化的鲁棒性,并不能取得很好的效果。针对这一问题,文章提出了一种使用图像感知哈希作为匹配特征的生成方法进行目标跟踪。图像感知哈希原本是用于寻找相似图片的图片匹配的方法,具有对尺度变化、光照变化不敏感,计算容易等优点。将感知哈希用于目标跟踪,可以减少计算量,并在检测到目标后,结合有效的运动模型更新策略,解决目标跟踪中出现的偏移、遮挡等问题,达到快速、准确的跟踪效果。

关键词:运动目标跟踪;生成方法;图像感知哈希;OPENCV

中图分类号:TP392 文献标识码:A 文章编号:1009-3044(2016)14-0179-03

随着计算机信息技术的发展,计算机视觉已经成为研究热点之一,运动目标跟踪更是计算机视觉领域的热门课题。如今运动目标跟踪技术已经广泛用于监控、交通、军事、医疗的等领域。视频是一帧一帧连续播放的图像序列,目标跟踪是指从视频的某一帧开始,通过目标检测方法找到到运动目标或者人工指定跟踪目标,在之后的连续图像序列中持续对目标进行识别和跟踪。

目标跟踪方法通常分为判别方法和生成方法两种。判别方法把跟踪看成一个二分类的问题:以目标物体作为正样本,背景作为负样本,通过训练分类器可以把目标从背景中分离出来,从而实现对目标的跟踪。目前很多判别方法提出,其中STRUCK是判别方法中最杰出的[2],但是此方法需要大量的计算,速度较慢,并不能满足实时跟踪的需求。生成方法首先学习外观模型来表示目标,然后在搜索区域的候选模型中选择出与目标模型误差最小的一个作为跟踪结果。生成方法最早可以追溯到Lucas和Kanade提出的基于原始图像的整体模板法,即LK方法。仅仅使用原始图像作为模板,不能很好地提取目标外观特征,适应目标外观变化,且需要的计算量较大。Hager和Belhumeur 等人改进了LK方法,对原始图像进行降维,使用对光照不敏感的低维特征作为目标外观的表示。在此基础上,Black和Jepson又提出了使用一定的学习策略进行模型更新,从而更好的处理目标外观的变化。此时生成跟踪方法的框架已经形成。随后很多模型的不同特征被用于跟踪。如Comaniciu人等结合颜色直方图和数学上的均值偏移方法,提出了meanshift方法。Collins 拓展了可自适应尺度变换的改进方法camshift。为了更好的处理遮挡和提升实时性能,局部稀疏表示(PCA、稀疏编码等)和多种特征的联合表示也被用于目标跟踪。[1][2]

跟踪的过程中会出现众多的干扰因素影响跟踪的性能,如尺度变换,光照变化,偏移,遮挡等问题。处理这些因素的关键在于构造有效且鲁棒的外观表示模型。文献[1]证明了模型表示的选择对于跟踪性能的影响最大。于是近些年来,跟踪问题更多的焦点集中在寻找有效的表示模型上。本文提出了一个有效的生成方法,使用图像感知哈希作为模型表示进行跟踪,

具有尺度不变性和运算速度快的优点,并且引入了模型更新策略,从而解决了目标跟踪中出现的偏移、遮挡问题。

1图像感知哈希

感知哈希是指将具有相同感知内容的多媒体信息映射为一段数字摘要,用来对媒体信息进行比对。图像感知哈希则是对数字图像的感知信息进行摘要。传统的哈希技术仅仅简单地把图片看作一个二进制文件进行处理,而没有考虑到图像上的感知信息。随着网络上有损压缩格式的使用,传统的哈希算法如MD5、SHA1等方式不再适用于图片的匹配,于是提出了图像感知哈希技术,利用的图片的感知特征作为摘要信息来进行图像的识别和认证[4]。

在MD5、SHA1这样的加密哈希方法中,得到的哈希值仅仅是一段固定长度的二进制数字,和其本身的内容没有关系。单向性和抗碰撞性要求它对输入的二进制数据的比特变化敏感,也就是说,即使输入数据一位的比特变化,也会导致输出哈希值的明显的随机变化。

对于数字图像而言,图像数据格式的变化,普通的图像润饰或者加工操作,图像通信的信道噪声等在剧烈改变图像二进制数据的同时,一般都只会影响图像呈现信息的质量,而不会改变其内容。因此大部分感知哈希算法都具有共同的基本特性:图像可以放大缩小,可以有不同的方向、角度,甚至可以有细微的颜色差别,其哈希值都应该保持不变或者在一个指定的阈值内变化。而以上的特性也正好适用于目标跟踪中用来匹配目标。

2提出的算法

近些年来,已经有很多不同的图像感知哈希算法提出[5]。其中包含很多复杂的甚至可以加密的方法,但是经测试,即使将很简单的感知哈希算法作为特征使用到跟踪中,也能起到很好的效果。

2.1模型表示

本文中采取的感知哈希作为跟踪目标的模型表示,计算方法如下:

1)将原图像转化为灰度图,灰度图就可以很好的保存图像轮廓和细节,减少计算量,提高速度。

2)缩小图像尺寸,把原大小转化为8*8的方形图像。缩小尺寸可以大幅度减少图像的高频信息,保留低频信息。低频信息反映了图像的整体框架,具有对放大、缩小、平移、模糊的不变性,这也是图像哈希可以作为目标跟踪匹配特征的关键原因。

3)计算所有像素灰度的平均值,用于和每个像素比较。

4)将所有的像素值与平均值进行对比,大于等于平均值记为1,小于平均值记为0。

5)把这64个2进制位由在原图像从左到右从上到下的顺序排列,形成哈希值。

以Lena图为例,计算图像感知哈希的步骤如图1所示:

2.2 运动模型和观察模型

跟踪算法使用图像感知哈希作为模型特征,以两个哈希值之间的汉明距离作为评判相似度的标准(观察模型)。汉明距离表示哈希值中对应位置二进制位不同的个数,汉明距离越大,说明图像越不相似,反之则越相似。

汉明距离的计算:d(x,y)=∑x[i]y[i],如下所示。

由[1]我们得知,在选取合适特征情况下,即便是用很简单的跟踪框架也能够实现很好的跟踪效果。本系统在第一帧使用人工标注的方法圈定要跟踪的目标,之后的每一帧使用滑动窗口作为运动模型搜寻目标:在当前目标2*2的范围内寻找目标,使用汉明距离作为观察模型来从候选的模型中选取最接近目标的一个。如图2。

2.3偏移问题

在模型更新的过程中,由于误差积累,会导致跟踪结果偏移。对于此问题,本算法采取使用第一帧和上一帧的权重共同跟踪的方法,第t帧的模型M(t)=αM(0)+(1-α)M(t-1),其中α表示第一帧中目标模型所占的权重。随着时间变化,第一帧的权重应逐渐减小。本方法中取α=1/(1+t)。

2.4 遮挡问题

当模型被遮挡时,如果继续更新,会导致更新到覆盖物更新到了错误的模型。所以本方法中的模型更新针对遮挡也提出了解决方法。d(h)表示汉明距离,当0

2.5算法流程

1)在视频的某一帧使用鼠标拖拽圈定要跟踪的目标,作为模型T,大小为p*q,左上角像素的位置为(m,n)。

2)计算选中窗口区域的感知哈希值H(T)。

3)下一帧F中使用在当前位置的2*2大小的窗口中滑动,计算每个大小为p*q的子窗口Fi,j的哈希值H(Fi,j)。i,j为子窗口Fi,j 左上角的像素在F图中的坐标,称为参考点。i,j的取值范围:m-p/2

4)比较搜索窗口和模型窗口的哈希值的汉明距离D(H(T),H(Fi,j)),选取所有子窗口中汉明距离最小的子窗口作为跟踪结果。

5)根据提出的模型更新机制决定是否将跟踪结果Fi,j作为下一帧的跟踪模型T,重复步骤2到步骤5。

3 基于Opencv的系统实现及仿真实验

Opencv是一个开源的数字图像处理和计算机视觉的函数库,实现了图形图像处理和计算机视觉方面的很多通用算法,方便开发人员将注意力集中于算法的实现而不需要自己写一些底层操作代码,避免造成时间和精力上的浪费。

Opencv提供了数组、序列、矩阵、树等基本结构,也包含了差分方程求解、傅里叶分析、积分运算、特殊函数等众多高级数学计算函数,以及各种图像处理操作和目标跟踪、摄像机校准、三维重建等高级视觉函数。本设计中的基本功能如读取视频,鼠标选取操作,缩放图像,彩色图像转化为灰度图像等基本功能都由opencv提供的函数实现。

本设计基于windows10+visual studio 2013+opencv2.4.11环境,实现了在固定的背景的情况下进行稳健的目标跟踪,具有尺度不变性和光照不变性,达到不需要预先训练的每秒30帧以上的实时跟踪效果。图3为程序在第82、269、550、736帧跟踪到的结果。

4 结论

实验结果表明,在目标跟踪中引入图像匹配中的感知哈希方法作为跟踪特征,有较快的运行速度、准确度和鲁棒性,可以作为一种良好的特征用于目标跟踪。虽然与Object Tracking Benchmark[2]中排名靠前的算法相比,本设计仍然有差距,但是提出了一种将图像感知哈希引入跟踪的概念。近些年来还不断有新的感知哈希算法提出,不乏兼具尺度不变性,旋转不变性等良好特性的感知哈希算法,试想将这些方法用于运动目标跟踪,会具有更好的跟踪效果,可作为目标跟踪发展的下一步研究方向。

参考文献:

[1] N Wang, J Shi, DY Yeung, J Jia. Understanding and Diagnosing Visual Tracking Systems[C].International Journal of Computer Vision, 2015.

[2] Wu Y, Lim J, Yang M H. Object Tracking Benchmark[J]. Pattern Analysis & Machine Intelligence IEEE Transactions on, 2015.

[3] 徐光柱,雷帮军.实用性目标检测与跟踪算法原理及应用[M].北京,国防工业出版社, 2015.

[4] Schneider M, Shih-Fu Chang. A Robust Content based Digital Dignature for Image Authentication[C]. Proc of IEEE International Conference on Image Processing, Lausanne, 1996.

[5] 张慧. 图像感知哈希测评基准及算法研究[D].哈尔滨工业大学, 2009.

[6] Adrian Kaehler, Dr. Gary Rost Bradski. Learning OpenCV [M].New York:oreilly, 2008.

上一篇:送你一颗不会老的心 下一篇:中国广播电视类上市公司效率研究