基于视频图像的车辆目标识别

时间:2022-10-14 01:13:42

基于视频图像的车辆目标识别

摘要:针对目前数字图像目标识别方法中存在识别精度和实时性的问题,该文提出一种结合Gabor小波和神经网络的图像目标识别方法。该方法首先对图像进行预处理、用Canny算子进行边缘提取,然后通过神经网络获取最优的双Gabor小波复合滤波器参数,再采用参数优化过的滤波器组提取目标的特征向量,最后进行目标的分类和识别。实验表明这种方法鲁棒性好、识别率高,具有较广泛的实际应用价值。

关键词:Gabor小波滤波器;神经网络;目标识别

中图分类号:TP391文献标识码:A文章编号:1009-3044(2009)36-10328-02

Image Target Recognition Based on Gabor Wavelet and Neural Network

YE Miao1, ZHOU Ai-jun1, YUAN Feng2

(1.Nanjing Normal University, Taizhou College, Taizhou 225300, China; 2.Yangzhou Branch of China Telecom, Yangzhou 225009, China)

Abstract: At present, many algorithms for object recognition have a narrow applicability and a low effectiveness. To address this issue, this paper presents an image recognition method which based on Gabor wavelet and neural network. First of all, the images are pre-processed and the edges of objects are extracted with Canny operator. And then, the combination of Gabor wavelet and neural network is used to obtain the best parameters of dual-compound Gabor wavelet filters. At last, the filter of which parameters had been optimized is applied to extract the eigenvector of the target for object classification and identification. Experiments show that this approach is robust, with high recognition rate, and thereafter with a wide range of practical application.

Key words: gabor wavelet filter; neural networks; target recognition

数字图像目标的自动识别是目前国内外研究的热点。它在智能交通系统,工业生产自动化和机器人视觉等诸多领域有极高的应用价值[1], 由于Gabor小波变换在分析数字图像的局部区域频率和方向信息方面具有优异的性能,故在计算机视觉及纹理分析中已经得到广泛应用。而神经网络又具有自学习性、自适应性、强鲁棒性和推广能力。因此在本文提出一种基于双Gabor小波复合滤波器提取图像目标特征向量。并结合神经网络得到最优化滤波器参数值的方法,以此对图像目标进行识别。

1 图像预处理

本研究以车型图像为例进行目标识别。采用低误判率和高定位精度的Canny算子[2]进行边缘检测,检测结果如图1所示。

a) 3个典型样本 b) 边缘检测后的样本

图1 3个典型样本和预处理结果

2 Gabor小波滤波器

二维的Gabor小波滤波器因可以同时获取空间和频率域的最小不确定性而常用于信号处理,并且它和人眼视网膜神经细胞的感受非常相似,从而应用于图像处理、理解、识别等领域,在人脸和特征识别领域[3]也已成功地应用。

二维Gabor小波滤波器定义为,其极坐标形式定义为

(1)

其中,δ为高斯函数的标准差,ω0为复平面波的空间频率,φ=arctan(ν/μ)是方向角, r=,θ=arctan(y/x)。

本文用两组实Gabor小波滤波器线性组合成复合滤波器ΣnwnGn(n=1,2)。可以根据图像目标的特点初始化w1G1+w2G2的参数值,其中w为列向量,其包含复合滤波器的线性组合系数wn,G为矩阵,每一列包含复合滤波器的一个Gn。为了获取目标的局部特征,可以假定目标的尺寸在一定的范围之内,因此参数α,b应小于目标的尺寸,一般取这个范围的下限。复合滤波器参数的选择要使滤波器窗口中心位于目标头部时的相关输出区别于滤波器窗口中心位于目标尾部时的相关输出,其中J是标准函数。

标准函数的选择:假设两类待识别目标的特征矢量分别为f1,f2,在一般情况下,为了准确地区分两类目标,特征矢量f1、f2应当分属于特征空间中的两个不同的区域。最常用的衡量两类目标特征矢量分离和聚合程度的标准函数是:

(2)

式中,式中s表示输入图像的平移,zi表示所有属于类别i的s的平均值。E,F只与输入图像有关,对识别问题而言是固定的;由(2)式可知J与G,w有关,可以用神经网络选择G,w的参数以活得最大的J值。

神经网络的结构如图2所示。它由3层神经元(输入,输出和隐含层)和两个连接权重集合(G,w)组成。输入层神经元的数据是不同的供训练神经网络用的图像像素数据。输入层和隐含层之间的连接权重集合是矩阵G。在隐含层神经网络计算输入训练图像和矩阵G中的Gn的矢量内积。隐含层和输出层之间的连接权重集合是ω。输出层的结果用来计算J,再根据J值修改G,w以期得到最大的J值。

设A=GTEG, B=GTFG,由(2)式可知,J=(wTAw)/(wTBw)。为了找到使J最大的ω,可以采用以下的梯度迭代公式:

(3)

式中λw为收敛速度的步长。本文中,每一步迭代使ω改变大约1%。同理也可以得到使 最大的G。G包含α,b,ω,φ四个参数,于是有下列迭代公式:

(4)

式中,等同。

式中,λa,λb,λω,λφ是迭代步长。每一步迭代使α,b,ω,φ分别改变大约1%。G包含两个实Gabor小波滤波器,a,b,ω,φ都是矢量;diag是取对角线上的元素。

4 实验结果

实验中输入图像是3类典型的汽车图像(小汽车、卡车和客车),参见图1。特征矢量由20个分量组成,即在输入图像与复合滤波器相关运算结果中沿其过中心的水平线上均匀取20点组成。结果选取80×60的小汽车图像为例。

首先用(3)式迭代100次,再用(4)式迭代1次,最后重复上述过程300次。标准函数J随迭代次数的变化情况参见图3,从中可以看出,标准函数J随迭代次数增加到峰值后,再下降到一个稳定值3.80,而且稳定值约为J初始值的4倍。这反应了本文算法的有效性和高效性。图4是滤波器G的连接权重w复合滤波器参数随迭代次数的变化情况,图中上线对应于滤波器G1的连接权重w1,下线对应于滤波器G2的连接权重w2。

图3 J随迭代次数的变化曲线 图4 随迭代次数的变化曲线

图5给出a,b,ω,φ随迭代次数变化的曲线图。a)中,最下面与横坐标重叠的线是ω;水平线是φ,大小为π/2;最上面曲线是b,最后稳定于3.45;第二条曲线是a,稳定于2.00。b)中,最下面一条曲线ω与横坐标重叠;b线急剧下降,最后稳定在0.25;a线稳定在1.95。

a) 滤波器G1b) 滤波器G2

图5 a,b,ω,φ迭代次数的变化曲线

测试样本是训练样本时,当使用表1的复合滤波器来提取特征时识别率为81%,当使用表2时识别率为99.5%;当测试样本不是训练样本时,识别率分别为70.3%和93.4%。可见本文算法对复合滤波器参数的选择是有效的。

以上的仿真实验是针对同三种目标的同一方位的图像进行的,该算法具有较强的鲁棒性,取得了较好的识别结果。

参考文献:

[1] 杜宇人,高浩军.基于车辆轮廓定位匹配的车型识别方法[J].扬州大学学报:自然科学版,2007,10(2):62-65.

[2] WANG Li-wei, ZHANG Yan, FENG Ju-fu, et al. On the Euclidean distance of images [J].IEEE Trans. on Pattern Analysis and Machine Intelligence(S0162-8828),2005,27(8):1334-1339.

[3] 赵英男,杨静宇.一种改进的Gabor滤波器特征抽取算法及其应用[J].系统仿真学报,2005,17(9):2236-2238.

上一篇:基于3DsMax材质与贴图技术的教学探讨 下一篇:基于软交换技术的网络安全问题研究