一种新的图像检索方法

时间:2022-07-08 03:33:19

一种新的图像检索方法

摘 要:常规基于内容图像检索的方法是提取图像的颜色、纹理等物理特征,运用相似性度量准则从图像库中查询相似的图像。为了提高图像检索的正确率,这里提出改进的方法。具体方法是:提取图像的物理特征,并将特征作为支持向量机(SVM)的输入向量,对图像进行分类,然后利用分类结果,对检索图像进行相似性匹配,从同类图像中找出相似的图像。实验结果显示,该方法的检索结果优于常规方法。

关键词:图像检索;图像分类;支持向量机;相似性匹配

中图分类号:TN911.73; TP317.4 文献标识码:B 文章编号:1004-373X(2008)22-115-03

New Method for Image Retrieval

ZHANG Yuhui,LI Jie,ZHENG Buqin,ZHOU Yingchun

(Suqian College,Suqian,223800,China)

Abstract:The normal method for Content-based Image Retrieval (CBIR) is to extract color and texture features of images,then uses similarity measure to find out those similar images.In order to improve the accuracy of image retrieval,an improved method is proposed,which uses image visual features as input vector for Support Vector Machine (SVM).Based on the result of image classification and matching of similarity measurement,images from the same class are found out.Experiment results indicate that the method is superior to CBIR.

Keywords:image retrieval;image classification;support vector machine;similarity match

1 引 言

伴随着网络和多媒体技术的发展,图像信息迅速膨胀,图像检索成为当前的一个研究热点。如何从大量的图像信息中检索出用户需要的图像,是图像检索需要解决的问题。近年,基于内容的图像检索(CBIR) 技术逐渐成熟。CBIR从图像中提取图像的颜色、纹理、形状等视觉信息,运用相似性度量准则,从图像库中找到相似的图像。但是,CBIR的检索准确率并

不高,如何提高检索效果是一个值得研究的问题。

2 图像视觉特征

图像的视觉特征有很多,主要有颜色、纹理、形状和对象空间位置等。

2.1 HSV非均匀量化颜色特征

HSV是最常用的颜色空间之一,它相比较于其他颜色空间更加符合人类的视觉感知,因此更适合应用于图像相似性比较。

文献[1]将H,S,V三个分量根据人的颜色感知进行非等间隔量化,分别划分成8份、3份、3份。并将量化后的3个分量合成一维特征矢量。

l=HQsQv+SQv+V(1)

其中Qs,Qv分别是S和V的量化级数,这里2个值都取3,则得到72维颜色特征。

l=9H+3S+V(2)

2.2 共生矩阵

图像的纹理特征记录了图像的空间信息,灰度共生矩阵是一种有效的纹理特征。它是表示灰度像素之间方向和距离的矩阵,即记录相隔(Δx,Δy)的灰度像素对出现的概率。Δx,Δy由像素的间距δ和方向θ表示,Δx=δcos θ,Δy=δsin θ。

作为对灰度共生矩阵的一种改进,提取RGB颜色空间的R分量和G分量,以及HSV颜色空间的H分量和V分量。对R,G,V三个分量等间隔分成8份,H分量非均匀量化为8份(同HSV非均匀量化)。再求出每个分量的(1,0),(1,1),(0,1),(-1,1)四个方向的矩阵。分别记录上述共生矩阵的统计量:反差、能量、熵和相关[2]。最后对特征归一化,得到32维特征向量作为图像的纹理特征。

3 支持向量机(SVM)

SVM是数据挖掘的一种新方法,是借助最优化方法解决机器学习问题的新工具。其主要思想是针对2类分类问题,在高维空间寻找一个最优分类超平面作为分类平面,以保证最小的分类错误率[3]。

分类问题的类型主要有线性可分和非线性可分2种。能使两类正确分开且类间距最大的平面称为最优分类超平面,记为(w・x)+b=0。类间距为2/w2。

最优分类超平面满足最大间隔原理:

min w2/2(3)

s.t. yi((w・xi)+b)≥1,i=1,2,…,n(4)

3.1 非线性支持向量机

设已知训练集T={(x1,y1),(x2,y2),…,(xn,yn)},其中xi∈Rn,yi∈{-1,1},i=1,2,…,n,Rn 为n维欧氏空间。选择适当的核函数K(x,x′),构造并求解最优化问题:

minα12∑ni=1∑nj=1yiyjαiαjK(xi,xj)-∑nj=1αj(5)

s.t. ∑ni=1yiαi=0(6)

0≤α≤C ,i=1,2,…,n(7)

得到最优解α*={α1*,α2*,…,αn*}T,选择α*的一个正分量α*j∈(0,C),计算表达式:

b* = yj -∑ni = 1yi α*iK(xi ,xj)(8)

然后,构造决策函数

f(x) =sgn∑ni = 1α*iyiK(xi,xj)+b*(9)

式(5)中的C是惩罚系数,它控制最大间隔和最小分类错误之间的矛盾。

3.2 核函数和支持向量

当存在一个从输入空间到特征空间的映射:Φ:xΦ(x),使得K(x,x′)= K(Φ(x),Φ(x′)),则,K(x,x′)是核函数。K(x,x′)是输入空间和特征空间之间的映射,选择不同的核函数意味着采取不同的标准对相似性和相似程度进行估计。

常用的核函数有:高斯径向基核(Gaussian RBF)、多项式核(Poly)、 Sigmoid核,表达式如下:

RBF:

K(x,x′)=exp-x-x′22σ2(10)

Poly:

K(x,x′)=((x・x′)+1)d(11)

Sigmoid:

tanh(κ(x・x′)+ν),k>0,ν

3.3 多类分类

在实际分类时,类的数目可能超过2类,对于这种情况,SVM可以应用不同的策略以达到分类效果。常见的多分类策略有[4]:

(1) One Per Class (OPC):对于K类分类情况,为每一类训练一个SVM,即训练K个SVM,确定某个对象的类别时,选择输出值最大的SVM所对应的类为该对象的类别。

(2) Pairwise Coupling (PWC):该策略每2个类需要训练1个SVM。则对于K类分类问题,共需要K(K-1)/2个SVM。

4 实 验

实验所用的图像来自Corel图像库(wang.ist.psu.edu/docs/related/),选择4类图像,每类100幅,分别是玫瑰、马、建筑和公交车,总共400幅图像。随机地选择每类的60%图像用作训练集,训练SVM。把余下的40%图像作为测试集,用训练得来的多类分类SVM对图像进行分类。

实验提取测试集中160幅图像的颜色特征(HSV非均匀量化)和纹理特征(共生矩阵)。在检索时,从测试集的每类图像中随机选出10幅图像,共40幅图像作为查询图像集合。对查询图像集合中的每一幅图像依次实行检索,并记录检索结果。

第1轮检索为基于内容的检索,分别实现颜色特征检索、纹理特征检索以及综合颜色和纹理特征的检索。第2轮检索为SVM检索,即先对测试集的图像进行分类,然后在分类基础上结合上述3种基于内容的图像检索方法[5,6]。

评价检索效果最常用的标准是准确率(Precision)和查全率(Recall),本文将采用这2种方法作为评价标准。

部分实验结果如图所示,图中左上角为要查询的图像,图1和图3是利用综合颜色和纹理图像检索出来的图像,图2和图4是先进行图像分类然后在分类的基础上,再进行检索的结果。

从图中可以看出,本文提出的方法明显优于传统的基于内容的图像检索。分析原因应是:在检索之前先对图像库进行图像分类,可以把图像的检索范围有效地减少,在属于同一类的子图像集上再进行特征相似性比较,所取得的检索结果理论上和实际上都比直接在图像集上进行特征相似性匹配要好。当然,可以看出,先进行分类后检索,对图像分类的结果依赖很大。但是,实验证明,用SVM对图像分类,分类正确率很高,在本实验中,分类正确率更是达到90%以上。因而,在检索之前先进行图像分类是可行的,而且可以看出结果令人满意。

图1 综合颜色和纹理特征的检索玫瑰结果

图2 利用综合特征结合SVM检索玫瑰的结果

图3 综合颜色和纹理特征的检索建筑结果

表1列出了分别用图像的颜色特征、纹理特征和综合颜色和纹理特征进行图像检索,每种特征检索,还分为直接特征检索(CBIR)和本文提取的方法(SVM)两种检索方法,总共6种图像检索。表中的值表示平均检索准确率。从表1中可以看出SVM方法比CBIR方法结果优越

图5比较了上述6种检索的平均准确率。从图中可以看出,利用综合特征结合SVM分类的方法,检索准确率近90%。

表1 检索准确率

类别

颜色纹理综合

CBIRSVMCBIRSVMCBIRSVM

玫瑰0.250.330.570.970.480.97

马0.740.830.550.620.650.82

建筑0.360.850.460.350.430.8

公交车0.810.950.760.820.840.98

图4 利用综合特征结合SVM检索建筑的结果

图5 平均检索正确率

5 结 语

本文提出在进行图像检索前,先进行图像分类,然后在分类的基础上再进行检索的方法。这样,就可以有效减小图像检索时的范围,在小范围内再进行相似性匹配,可以有效提高检索的准确率。实验结果显示,该方法效果很好。

参考文献

[1]曹莉华,柳伟,李国辉.基于多种主色调的图像检索算法研究与实现[J].计算机研究与发展,1999,36(1):96-100.

[2]刘忠伟,章毓晋.综合利用颜色和纹理特征的图像检索[J].通信学报,1999,20(5):36-40.

[3]Vapnik Vladimir N.The Nature of Statistical Learning Theory [M].Springer-Verlag,New York,Inc,2000.

[4]Edward Chang,King Shy Goh,Gerard Sychay,et al.CBSA:Content-Based Soft Annotation for Multimodal Image Retrieval Using Bayes Point Machines[J].IEEE Transactions on Circuits and Systems for Video Technology,2003,13(1):26-38.

[5]张瑜慧,胡学龙,陈琳.基于支持向量机的图像分类[J].扬州大学学报:自然科学版,2007,10(2):42-46.

[6]King Shy Goh,Edward Y Chang,Beitao Li.Using One-class and Two-class SVMs for Multiclass Image Annotation[J].IEEE Transactions on Knowledge and Data Engineering,2005,17(10):1 333-1 346.

作者简介 张瑜慧 女,1979年出生,江苏启东人,硕士。研究方向为图像处理与多媒体技术。

李 洁 女,1980年出生,江苏宿迁人,硕士。研究方向为本体与信息检索。

郑步芹 女,1981年出生,江苏盐城人,学士。研究方向为网络技术。

注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文

上一篇:基于RTL8019AS的单片机网络通信接口设计 下一篇:基于TMS320C64xx的多通道语音编码平台的设计