基于Contourlet变换与SVM的图像分类研究

时间:2022-10-15 04:24:56

基于Contourlet变换与SVM的图像分类研究

摘要: 由于Contourlet变换具有多分辨率分析、多方向性、各向异性等特点,能很好地捕捉图像的轮廓特征,利用Contourlet变换系数有利于特征的检测.提出了一种基于Contourlet变换与支持向量机(SVM)的图像分类方法.该方法首先对彩色图像灰度化后进行Contourlet变换,将得到的三层低频分量系数作为图像分类的语义特征,然后利用SVM分类器对图像进行分类.实验结果表明该方法具有较好的分类效果.

关键词: Contourlet变换;低频分量系数;支持向量机;分类器

中图分类号:TP 391.41

文献标志码:A文章编号:1672-8513(2011)06-0500-04

Image Classification by Using Contourlet Transform and SVM

XIA Wei, ZHAO Yong, ZHOU Weihong

(School of Mathematics and Computer Science,Yunnan University of Nationalities, Kunming 650031,China)

Abstract: Because Contourlet transform has the features of multi-resolution, time-frequency localization,directionality and anisotropy, it can well capture an image’s profile features well, while using the Contourlet coefficients can help the feature detection. This paper proposes an image classification method based on Contourlet transform and SVM. First, Contourlet transform is used to deal with color images after grayscale, then the low frequency coefficients are classified as the semantic features of images, and last, SVM classifier is used to classify images. The experimental results show that this method has better classification results.

Key words: Contourlet transform; low frequency coefficients; SVM; classifier

近年来,支持向量机(Support Vector Machine,SVM)技术在模式识别应用上的优越性能,已被广泛应用于图像分类、人脸识别、手写字体识别、验证码识别、系统辨识、文本分类以及图像检索等领域[1].文献[2]中提出一种利用SVM提取图像的高层特征,然后对图像进行级别分类的方法.文献[3]提出将PCA(主成分分析)与SVM(支持向量机)结合起来的方法对高光谱遥感图像进行分类.文献[4]针对人脸正面图像的人脸识别,构造了一种基于支持向量机(SVM)与纹理特征相结合的人脸识别方法.文献[5]提出了一种基于HMM-SVM混合模型的在线手写签名认证方法.基于SVM的验证码识别在电子商务中有着广泛应用,文献[6]对此进行了研究.

由于Contourlet变换能在任意尺度上实现任意方向的分解,擅长描述图像中的轮廓和方向性纹理信息,因此本文利用Contourlet变换来提取图像的特征作为语义特征,之后采用SVM来对图像进行分类.

1 Contourlet变换和支持向量机(SVM)

1.1 Contourlet变换

Contourlet变换是利用拉普拉斯塔形分解(LP)和方向滤波器组(DFB)实现的一种多分辨率的、局域的、多方向的图像表示方法[7].将金字塔分解和方向滤波器结合起来,就实现了Contourlet变换,而且单独使用任何一个都不能很好地描述图像.金字塔分解不具有方向性,而方向滤波器对高频部分能很好地分解,对低频部分则不行.二者的结合恰好能弥补对方的不足,从而得到了很好的图像描述方式,如图1所示:

1.2 支持向量机(SVM)

支持向量机方法是由Vapnik等在多年研究统计学习理论和风险最小原理的基础上提出来的.根据有限的样本信息在模型的复杂性(即对特定训练样本的学习精度)和学习能力(即无错误地识别任意样本的能力)之间寻求最佳折中,以期望取得最好的推广能力[8].

对于非线性分化问题,支持向量机的基本思想是:通过某种事先选择的非线性映射将输入向量映射到一个高维空间,在这个空间中构造最优分类超平面[9].该超平面通过解决如下的二次规划问题得到:

约束条件为:

∑1i=1aiyi=0,(0≤ai≤C), (2)

其中K(xi,xj)为核函数.核函数的种类有很多,我们一般选用径向基核函数:

K(x,y)=exp(-||x-y||22σ2). (3)

经过反复试验,选择最优参数σ=0.7,SVM分类器的惩罚参数C=1000.

支持向量机算法的目的在于寻找一个超面H(d),该超平面可以将训练集中的数据分开,且与类域边界的沿垂直于该超平面方向的距离最大,故SVM法亦被称为最大边缘(Maximum Margin)算法.待分样本集中的大部分样本不是支持向量,移去或者减少这些样本对分类结果没有影响,因此SVM法对小样本情况下的自动分类有着较好的分类结果.

由于图像分类在本质上是一个复杂的多类别问题,而SVM本身是一种处理2类问题的方法.在处理多类问题时,可以通过组合多个二值子分类器实现对多值分类器的构造.常见的构造方法有2种,一种是多类别策略,即一个分类器把每一类的样本与其它各类区分开来.另一种是1-1判别策略,即一个分类器只用来分类2类问题,通过若干分类器的组合,完成多类识别.本文采取1-1判别策略.

2 基于Contourlet与SVM的图像分类

文献[2]先将图像颜色量化,按人的颜色感知将HSV 3个分量进行非等间隔的量化,之后将HSV 3个分量转化为一维矢量,构成一个72阶的直方图,将其作为语义特征(颜色),然后利用SVM分类器进行图像分类.但是这种方法只对背景颜色较单一,由线条构成的图像的分类效果比较好.因此,本文在文献[2]基础上,对图像提取语义特征方面进行了改进.Contourlet系数表示图像边缘的系数能量更加集中[7],也就是说Contourlet变换对于曲线有“更稀疏”的表达.这使得在三层系数分解中能够提取到更多的图像特征.故本文利用Contourlet变换来提取图像的语义特征,而文献[2]是将颜色直方图作为语义特征,之后都是采用相同的SVM分类器来对图像进行分类,以希望得到更好的分类效果,并用仿真实验来验证本文算法.

2.1 本文算法步骤

1) 读取图像库中的4类图像共240幅图像,用rgb2gray函数将真彩色图像转换成灰度图像[10-12](Contourlet变换是建立在二维基础上,而真彩色图像为三维);

2) 对每一幅灰度化的图像进行三层Contourlet(CT)变换,使用的LP分解(拉普拉斯塔形分解)滤波器为“9-7”,DFB(方向滤波器组)滤波器为“pkva”;

3) 三层分解后提取的低频系数为图像的近似表示,为一元胞结构;

4) 由于“bus”类图像与“flower”类图像经过Contourlet变换三层分解的低频系数不同,因此可将其作为语义特征(轮廓),这样可以得到4个非线性分类器;

5) 对于每一个SVM分类器,它的训练集T={(x1,y1),(x2,y2),…,(xi,yi)},其中xi∈R2,它表示输入指标向量;yi∈{1,-1},是输出指标向量,为+1时表示该图像包含该语义,-1表示图像不包含该语义;

6) 随机选取每类图像的30幅图像作为训练样本,另外30幅图像作为测试样本,这样共有120幅训练样本,120幅测试样本;

7) 使用SVM分类器对Contourlet变换三层分解的低频系数进行测试,分类器采用1-1判别策略, 其主要计算方法说明如下:

对于m类模式的分类问题,可以设计m个2类分类器,其中每个分类器只区分一类模式

3 实验结果

3.1 实验准备

图像库共有“bus”,“dinosaurs”,“elephant”,“flower”4类图像,每类图像有60幅共240幅图像,库中图像均为JPG格式,大小均为384×256像素.本文实验采用Matlab 7.0作为实验工具.

使用查全率与查准率来表示实验的结果,它们的表示方法如下,假设A,B,C分别为:A(正确的结果),B(无关结果),C(漏掉的相关结果).那么正确率为A/(A+B+C),查全率为A(A+C),查准率为A(A+B).以下为实验结果:图2~5给出了4类图像的原图像、经过Contourlet变换提取出的三层系数图以及在HSV空间的颜色直方图.表1给出了图像经过分类之后的实验结果.

3.2 实验结果分析

从表1的结果来看,对于“elephant”类图像,本文方法训练集的正确率为83.3%,而文献[2]方法训练集正确率为92.5%,由此本文方法对于“elephant”类图像的分类结果不是很好.这主要是因为这类图像经过Contourlet变换后所提取的三层系数所包含的奇异点数比较少(从图4中三层系数图中可以看出来),因而所得到的语义特征不是很多,这也就导致了“elephant”类图像的分类效果不是很好.但是从表1可以发现,本文方法相较于文献[2]方法要有优势,其对于“bus”,“dinosaurs”,“flower”这3类图像的训练集正确率分别为96.7%95%以及98.3%,而文献[2]方法对于“bus”,“dinosaurs”,“flower”这3类图像的训练集正确率为93%、89.5%及88.9%,显然本文方法对这3类图像的分类效果更好.在测试集的查全率与查准率方面,本文方法也比文献[2]方法的分类效果更好.这主要是由于Contourlet变换具有方向性和各向异性,Contourlet系数中表示图像边缘的系数能量更加集中,并且能更“稀疏”地表示原图像.本文方法首先是将图像灰度化后再经过Contourlet变换提取出三层分解的低频系数作为语义特征,而图像的特征主要集中在三层分解的低频系数上,因此本文方法比文献[2]方法所得到的语义特征更多并且更稳定.总体上来说本文方法的分类效果较好.

4 结语

本文在文献[2]的基础上提出了一种基于Contourlet变换与SVM分类器的图像分类的新方法.提取语义特征的方法与文献[2]不同,文献[2]将HSV颜色直方图作为语义特征,而本文首先将图像灰度化后进行Contourlet变换,提取出图像的三层低频系数特征作为语义特征.通过实验表明,本文方法较文献[2]方法在分类效果上更有优势.由于RGB颜色空间不是一个均匀的颜色空间,与人眼的感觉差异较大.下一步工作将在更符合人眼视觉特性的HSV颜色空间中对图像的分类进行研究,以期望得到更好的分类效果.

参考文献:

[1]周明全,耿国华,韦娜.基于内容图像检索技术[M].北京:清华大学出版社,2007.

[2]胡斌斌,姚明海.基于SVM的图像分类[J].微计算机信息,2010, 26(1):155-157.

[3]张亮.基于PCA和SVM的高光谱遥感图像的分类研究[J].光学技术(增刊).2008,34: 184-187.

[4]鲁庆明.基于多分类支持向量机的人脸识别研究[D].武汉:武汉理工大学,2010.

[5]尤庆成.基于HMM-SVM混合模型的在线手写签名认证[D].合肥:中国科学技术大学,2010.

[6]殷光.基于SVM的验证码识别算法研究[D].合肥:安徽大学,2010.

[7]DO M N, VETTERLI M. The contourlet transform: an efficient directional multiresolution image representation[J].IEEE Trans On Image Processing,2005,14(12):2091-2106.

[8] VAPNIK V. Statistical learning theory[M]. New York:Wiley,1998.

[9]邓乃扬,田英杰.支持向量机―理论算法与拓展[M].北京:科学出版社,2009.

[10]GONZALEZ R C,WOODS R E,EDDINS S L.数字图像处理(MATLAB版)[M].阮秋琦,译.北京:电子工业出版社,2009.

[11]解洪胜,孙红梅,王连国. 利用SVM和Matlab开发图像内容检索系统的方法[J].云南民族大学学报:自然科学版,2010,19(3):207-210.

[12]孙崇璇.基于PCA主成分分析的人脸识别检测实现与分析[J].云南民族大学学报:自然科学版,2010,19(6):439-443.

上一篇:枯草芽孢杆菌KJ发酵豆粕制备新型蛋白肽饲料的... 下一篇:图像多标签学习综述