运动目标检测跟踪方法研究

时间:2022-04-15 03:38:31

运动目标检测跟踪方法研究

摘要:针对背景动态变化的场景,提出了一种基于全方位视觉的运动目标检测跟踪方法。通过目标在HSV颜色空间中的H值、目标间的欧氏距离和目标相交面积等特征融合,提高目标跟踪的鲁棒性。实验表明,所设计的方法能实现实时准确的运动目标检测与跟踪。

关键词:目标检测跟踪;形态学算子;背景干扰

中图分类号:TP18文献标识码:A文章编号:1009-3044(2010)07-1684-02

Research and Implementation of Moving Objects Detection and Tracking

CHENG Lei

(Department of Electronic Science and Engineering, Huanghuai University, Zhumadian 463000, China)

Abstract: Aiming at the scene of dynamic changes of background, a novel method of moving objects detection and tracing based on omni directional vision is presented in this paper. Robusticity of tracing objects is improved by the fusion of the value of hue in HSV color space, the Euclidean distance between objects and the intersection area. The experiment results testify that the method is practicable and accurate in real-time detection and moving objects tracing.

Key words: detection and tracing of objects; morphologic operators; intruders

运动目标的检测与跟踪是计算机视觉领域的重要研究课题,是视频监视、交通流量监测[1]、人体检测与跟踪[2-3]等应用的基础。视频图像中运动目标检测的主要方法有:光流法、帧差法和减背景法。光流法能较准确地检测运动目标,但计算量大,难于进行运动目标的实时检测。帧差法对环境变化的适应性强,但当运动目标上象素的纹理、灰度等信息相近时,易出现运动目标的空洞现象[4-5]。减背景法能提取较为完整的前景信息,但对运动敏感性不够。

目标跟踪的方法有基于模型的跟踪、基于区域的跟踪和基于特征的跟踪等方法。Karaulova建立了人体运动学的分层模型,主要用于单目视频中人体的跟踪[7]。基于区域的跟踪,即将跟踪目标分成几个小的区域来完成目标跟踪。该方法难于处理目标遮挡情况。基于特征的跟踪对非刚体运动目标具有很好的适应性,通常将运动目标的多个特征结合使用,以提高跟踪的鲁棒性。

1 目标检测

本文采用了基于减背景的目标检测方法。首先用统计方法[5,8]建立图像的背景模型,通过减背景得到前景图像,最后采用改进的二值图像连通域标记算法[9]对检测到的二值图像作分割处理得到运动目标。

1.1 统计方法建立背景模型

把获取的前N帧图像作为背景提取对像,设该序列帧图像中第i帧图像的像素点(x,y)的像素值为I(x,y),B(x,y)为N帧图像对应像素点的像素均值。这样可以减少突变对背景获取的影响,较准确的完成背景的初始化。

1.2 减背景法得到前景图像

将当前帧图像与背景图像对应像素点的像素值作差,如果差值大于阈值,则该点为前景像素点。

针对所得到的二值图像中存在的残留噪声和运动区域内部空洞,采用3×3矩阵算子,对二值图像作腐蚀处理,滤除其中的残留噪声;然后进行膨胀处理,恢复运动目标的前景区域,从而得到较为准确的运动目标信息。

1.3 改进的二值图像连通域标记算法

为确定运动目标的个数,采用改进的二值图像连通域标记算法对检测到的二值图像作分割处理。首先将二值图像完整扫描一遍,标记出所有的前景像素点并得出相应等价标记表,再对等价标记表中的标记值作等价对处理,最后完成二值图像的分割。

对二值图像按列从左到右进行扫描,若当前像素点为前景像素点,则按顺序查找该点周围上、左上、左、左下四个点的标记状况来确定当前点的标记值。传统二值图像连通域标记算法对周围这四个点需要相互进行等价标记处理,即需要进行6次等价判断;本算法只需对其中的A,B两种情况作判断,如图1所示,即只需作2次运算。

在扫描到A点之前,A的“上”和左下像素点位置(图1(a))是不连通的,即具有不同的标记值,等扫描过A之后,发现这两点是连通的,因此需要将这两个标记值放入等价标记表中作等价处理。B点的左上和左下像素点位置(图1(b))也需要作同样的处理。

等价对处理采用递归思想,每递归一次,将等价标记表中的等价对找出来,重新归类,同时将该等价对从等价标记表中删除,直到等价标记表中等价对的个数为零为止。最后完成运动目标区域的分割,得到相应的连通域个数。

2 目标跟踪

本文采用卡尔曼滤波预测目标在下一帧图像中出现的位置,以提高目标的匹配速度;利用目标在HSV空间中的颜色值、帧间目标的欧氏距离和相交面积等特征信息的融合,提高目标跟踪的准确性。

2.1 卡尔曼滤波预测下一帧目标位置

由于相邻两帧图像的时间间隔比较短,目标状态变化较小,可以假设目标作匀速运动,即目标做线性运动。因此,设系统采用的状态方程和观测方程分别为:

状态方程: xk=Axk-1+uk(1)

观测方程: zk=Hxk+vk(2)

其中,xk是k时刻n*l维系统状态向量;zk是k时刻m*1维观测向量;A是n*n维系统状态转移矩阵;H是m*n维系统观测矩阵;uk是k时刻n*1维随机干扰噪声向量;vk是k时刻m*l维的系统观测噪声向量。其中,uk、vk通常假设为互相独立的零均值高斯白噪声向量,令Qk和Rk分别为它们的协方差矩阵:Qk=E{ukukT},Rk=E{vkvkT}。

本文将滤波器的状态向量xk设为一个4维向量(xkvxkykvyk)T,其中xk和yk分别表示目标在k时刻所在位置的横坐标和纵坐标,vxk和vyk分别表示目标在k时刻X方向和Y方向上的帧间移动速度。相应的状态转移矩阵、观测矩阵以及协方差矩阵分别设为:

其中t表示连续两帧间的时间间隔。本实验中t的取值为0.05。

2.2 目标特征值选取

在全方位视觉中,运动目标的形态有一定的扭曲,而目标的颜色特征对目标的尺寸、方向等依赖性较小,具有较高的目标匹配鲁棒性。本文根据目标的位置、大小和目标像素点的颜色值建立匹配矩阵,实现目标间的匹配。

根据目标的位置得到目标间的欧氏距离。根据目标区域大小计算相交面积。为解决两个不规则区域的相交面积的计算复杂性,采用计算目标外接矩形的相交面积进行近似。由于RGB颜色空间在光照下不能准确地表示像素点的颜色信息,而HSV颜色空间对色差的感知较均匀,目标受到光照影响时,HSV空间颜色值变化幅度小,能较稳定地反应目标的颜色值,因此,采用HSV颜色空间。考虑到大部分的视频采集设备都基于RGB颜色空间,因此需要进行RGB到HSV的转换,设m=max(r,g,b),n=min(r,g,b),delta=m-n,则

v=m(3)

(4)

其中h值满足h=h+360,if h

2.3 目标匹配

建立匹配矩阵前需要判断两个目标间的匹配关系。本文以两个目标的欧氏距离以及相应的颜色特征值来确定目标的匹配关系。当距离小于一定阈值且颜色特征值在一定阈值范围内时,即判定两个目标匹配,否则不匹配。

假设上一帧图像中记录的目标为x1,…,xn,当前帧中记录的目标为y1,…,ym,建立一个大小为m*n的矩阵R,用来表示第xi个目标的卡尔曼预测值与第yj个目标的匹配关系,矩阵R表示为:

(6)

其中;i=1,2…n,j=1,2,…m。

2.4 实验结果与分析

实验中,图像采集的帧率为10fps,实验室为实验场景。

单目标跟踪图像。目标从门口进入,以不同的步速走到窗台附近,结果表明:当目标以低于2m/s的速度运动时,能准确地实现目标的跟踪。

多目标跟踪图像,场景中有多个真实目标和窗帘运动造成的虚假目标。本方法能过滤其中的虚假目标,并且实现多目标运动的实时准确跟踪。而文献8的方法能检测场景中的运动目标,但不能过滤虚假目标,并且出现过分割现象,造成场景中目标个数过多,系统计算量加大,最后导致系统丢帧现象严重,无法实现实时准确跟踪。

3 结束语

本文针对背景动态变化的场景,提出了一种有效的运动目标检测与跟踪方法。该方法能较准确地实现背景的估计、背景模型的更新。通过引入形态学算子,过滤背景干扰物,提高运动目标检测的准确性。通过采用卡尔曼滤波预测目标下一帧的位置,缩小目标的搜索范围,提高匹配速度;选取HSV颜色空间的h分量和目标的位置,大小作为特征值,提高跟踪的鲁棒性。实验表明,本文方法能够实时准确地实现运动目标的检测与跟踪。

参考文献:

[1] Ribaric S,Adrinek G,Segvic S.Real-time active visual tracking system[C].Proc. of the 12th IEEE Mediterranean,Electrotechnical Conf.,2004,5:231-234.

[2] Wren CR,Azarbayejani A,Darrell T,Pentland AP.Pfinder:Real-time Tracking of the Human Body[J].IEEE Trans.on Pattern Analysis and Machine Intelligence,1997,19(7):780-785.

[3] Haritaoglu I,Harwood D,Davis D.W4:Real-time surveillance of people and their activities[J].IEEE Trans.on Pattern Analysis and Machine Intelligence,2000,22(8):809-830.

[4] 潘石柱,殳伟群,王星.基于自适应背景的实时运动物体检测[J].计算机应用,2004,24(10):94-96.

[5] 关向荣,任金昌.视频监视中背景的提取与更新算法[J].微电子学与计算机,2005,22(1):95-97.

[6] Stauffer C,Grimson W.Adaptive background mixture models for real-time tracking[C].Proc IEEE Conf.on Computer Vision and Pattern Recognition.Fort Collins,Colorado: IEEE,1999:246-252.

[7] Karaulova I,Hall P,Marshall A.A hierarchical model of dynamics for tracking people with a single video camera.Proc. British Machine Vision Conference,Bristol,UK,2000.352-361.

[8] 林洪文,涂丹,李国辉.基于统计背景模型的运动目标检测方法[J].计算机工程,2003,29(16):97-99.

[9] 徐正光,鲍东来,张利欣.基于递归的二值图像连通域像素标记算法[J].计算机工程,2006,32(24):186-188.

上一篇:一种基于投影数据库的SPAM算法 下一篇:决策树在网络入侵检测中的研究与应用