基于不变矩特征及SVM的图像识别

时间:2022-07-12 12:30:44

基于不变矩特征及SVM的图像识别

摘要:该文提出了一种利用不变矩和支持向量机(SVM)对图像进行识别的方法。该方法提取图像的7个不变矩作为特征矢量,对得到的特征量应用支持向量机进行图像分类和识别。该文通过试验验证了此方法的有效性。

关键词:不变矩;支持向量机;图像识别

中图分类号:TP391.41文献标识码:A文章编号:1009-3044(2010)11-2711-02

Image Recognition Based on Moment Invariant Feature and SVM

ZHOU Jie, ZHANG Heng

(Nanjing University of Information Engineering School of Electronics and Information Engineering,Nanjing 210044,China)

Abstract: Based on moment invariant feature and support vector machines,an efficient recognition method for image is proposed in this paper.Firstly,it extracts the six invariant moments as feature vectors,and the classification and recognition of image for the feature content acquired from that were performed by support vectors machine finally. Experiment result demonstrated that the method is effective.

Key words: moment invariant; support vector machines; image recognition

在进行识别图像时,应具有的一个重要特性就是对图像的平移、旋转及比例变换具有不变性。一个最直观的方法是要求图像特征本身具有“不变性”,即尽可能寻求图像本身的“不变性”特征。因此,不变性特征的研究一直是感知科学和计算机视觉的研究重点。Hu[1]定义的不变矩算法就是一种通过提取具有平移、旋转和比例不变性的数学特征,从而进行图像识别的方法。支持向量机(Support Vector Machines,SVM)方法能够较好地解决小样本,非线性,高维数等问题[2],对于图像识别是一个较好的方法。本文提出了一种基于7个不变矩和SVM的图像识别算法。

1 图像的特征提取

特征提取是对模式所包含的输入信息进行处理和分析,将不易受随机因素干扰的信息作为该模式的特征提取出来,特征提取过程是去除冗余信息的过程,具有提高识别精度、减少运算量和提高运算速度的作用.良好的特征应具有可区分性、稳定性、独立性以及数目小等特点。特征提取是图像模式识别的基础。

矩特征是利用力学中矩的概念,将区域内部的像素作为质点,而将像素的坐标作为力臂,并以各阶矩的形式来表示区域形状特征的一种矩描绘算子。

设物体的二维图像用f(x, y)表示,那么其(p+q)阶原点矩定义为

(1)

原点矩可提供图像的丰富信息,是模式识别中常用的特征。由于矩提供了图像的相同表示,图像能从它的所有阶矩中重构,因此每个矩系数传递了一定数量的图像信息。

中心矩定义为

(2)

(其中,p,q=0,1,2,….,x0,y0为图像的中心坐标, x0=m10/m00, y0=m01/m00)

直接用普通矩或中心矩进行特征表示,不能使特征同时具有平移、旋转和比例不变性。如果利用归一化的中心矩,则图像的特征对平移、旋转和比例变换均具有不变性。用零阶中心矩对其余各阶中心矩进行归一化,可以得到图像的归一化中心矩

(3)

Hu定义了7种在平移、缩放和旋转操作下不变的矩,这些不变矩是归一化中心矩的组合。式(3)中,取p,q=0,1,2,3时,这7种不变矩定义如下:

p+q=2

m1=η20+η02

m2=(η20-η02)2+4η112

p+q=3

m3=(η30-3η12)2+(η03-3η21)2

m4=(η30+η12)2+(η03+η21)2

m5=(η30-3η12)(η30+η12)[(η30+η12)2-3(η21+η03)2]+(η03-3η21)(η03+η21)

m6=(η20-η02)[(η30+η12)2-(η21+η03)2]+4η11(η30+η12)(η03+η21)

m7=(3η21-η03)(η30+η12)[(η30+η12)2-3(η21+η03)2]+(η30-3η12)(η21+η03)[(η03+η21)2-3(η30+η12)2]

2 基于支持向量机的图像识别

传统的统计模式识别方法只有在样本趋向于无穷大时,其性能才能有理论的保证,而实际应用中样本总是有限的,人工神经网络因为具有小样本学习能力而得到了广泛的应用,但是还存在问题,如局部极小点问题,过学习与次学习问题。SVM的最大特点是根据Vapnik的结构风险最小化原则,尽量提高学习的泛化能力,即由有限的训练集样本得到的小误差仍能够保证对独立的测试集小的误差。

要实现支持向量机的多类分类,首先要实现两类分类。支持向量机的分类算法包括两部分,支持向量机的训练和支持向量机的分类。训练的步骤包括输入训练样本,选择合适的核函数,确定核函数参数及乘法参数,执行训练算法并求得最优拉格朗日乘子a*和偏差值b*。分类的步骤包括输入待测样品,利用训练好的拉格朗日乘子a*,偏差值b*以及核函数,求解判别函数f(X), 根据sgn (f(X))的值,输出类别。

多类分类算法就是在上述两类分类的基础上加以改造实现的。假定待识别的图像有c类,记为S1,S2,…,Sc。设计c个上述二类分类器fi (i=1,2,…c).每一个fi用其中的一类样本Si作为正样本训练,系统输出sgn (f(X))为+1,而其它所有样本Sj (i j)作为负样本训练,系统输出sgn (f(X))为-1,最后将训练结果保持在指定二维数组svmBuffer中。测试阶段,依次计算测试样本与上述训练所得数组svmBuffer的每一个元素svmBuffer(i,j)的sgn (f(X))值,结果为+1则判为i类,i类计数器加1;结果为-1则判为j类,j类计数器加1。最后比较每一类的计数器里的值,将样本判为取最大值的那一类。

3 实验结果

3.1 实验数据来源

本实验应用图像的7个不变矩特征来识别正方形,三角形,圆形,X形,L形,椭圆形6种图像模式。分别以上述6种模式图像及它们旋转30°,45°,60°,90°,150°以及扩大1.2倍,1.5倍,2倍后的54幅图像作为训练样本。以旋转100°,120°,扩大1.8倍及其组合的30幅图像作为检测样本。

3.2 识别检测结果

在用SVM进行训练和识别的时候选用的是最简单的线性核函数(k=)。二次规划中的拉格朗日乘子上界C取200.利用上述数据分别进行训练和检测,其识别的正确率达到了100%。

4 结束语

本文提取图像的7个不变矩作为特征矢量,应用SVM方法对二值图像进行了识别。由于支持向量机在构造判别函数时,先在输入空间利用核函数比较向量,对结果再做非线性变换,使大的工作量在输入空间而不是在高维特征空间中完成,大大减少了计算的工作量,使其对某些识别问题显示出极大的优越性。识别结果表明该方法具有很好的识别效果,是一种有效的图像识别方法。

参考文献:

[1] Hu Ming-Kuei.Visual Pattern Recognition by Moment Invariants[J].IRE Transactions on Information Theory,1962:179-187.

[2] 边肇祺,张学工.模式识别[M].2版.北京:清华大学出版社,2003:296-304.

上一篇:数字媒体未来发展趋势――数字媒体与增强现实... 下一篇:语音文件的读取及软件实现