一种基于区域颜色特征的图像相似性匹配算法

时间:2022-10-08 01:52:52

一种基于区域颜色特征的图像相似性匹配算法

摘 要:在基于内容的图像检索中,普通的基于颜色特征的相似性匹配算法丢失了图像颜色的空间信息,影响到相似匹配的精确度。为了提高图像检索的效果,提出一种基于区域颜色特征的图像相似性匹配算法。该算法在提取图像颜色统计特征的同时,考虑其空间分布,从而提高了图像检索的查准率,具有较强的实用性。

关键词:区域颜色直方图;相似性匹配;图像检索;空间信息

中图分类号:TP391文献标识码:A

文章编号:1004-373X(2009)10-094-02

Similitude Matching Algorithm of Digital Image Based on District Color Feature

YAO Xudong1,JIA Dachun1,JIA Xin2

(1.Modern Educational Technique Center,Luoyang Institute of Science and Technology,Luoyang,471023,China;

2.Software Technology Institute,Zhengzhou University,Zhengzhou,450002,China)

Abstract:In the content-based image retrieval,ordinary based on color feature,the similitude matching algorithm lost the image color spatial information,and affected the similitude matching precision.In order to improve the image retrieval effect,a similitude matching algorithm about the digital images based on the district color feature is proposed.During extracting the statistical features of color about images,but also its spatial distribution is considered,the image retrieval accuracy ratio,and it is highly practical are improved.

Keywords:district color histogram;similitude matching;image retrieval;spatial information

在数字图像检索方面,基于内容的图像检索CBIR(Content-Based Image Retrieval)已成为图像检索的热门技术。该方法通过提取图像的底层特征,如色彩、纹理和形状等,并以此作为图像内容的表达和相似性判别要素,从而实现图像的高效索引和检索。该文给出一种基于区域颜色特征的图像相似性匹配算法,并利用C#语言实现。

1 基于颜色特征的图像检索

色彩是图像内容组成的基本要素之一,也是人们识别图像的主要感知特征。相对于其他特征而言,图像的颜色表现出相当强的鲁棒性,其对大小、方向都不敏感。基于颜色特征进行图像检索需解决的主要问题为:颜色模型的选取、颜色特征的提取和相似性匹配计算。

颜色模型又称颜色空间,是指颜色的表示方法。这里的研究采用RGB颜色模型,即红、绿、蓝(RGB)三基(原)色模型。描述图像颜色特征的一种常用方法为图像的颜色直方图(ColorHistogram)。假设一幅图像P的颜色由M级组成,每一种颜色值用Ci(i=1,2,…,M)表示,在整幅图像中,具有Ci颜色值的像素数为ni,则这一组像素统计值n1,n2,…,nM便构成该图像的特征值颜色直方图,可用向量组N(n1,n2,…,nM)表示。示例图像和对应的颜色直方图分别如图1和图2所示。

图1 示例图片

图2 图片对应的直方图

颜色直方图是通过统计图像中每种颜色的像素数目而获得的。例如,对24位的RGB图像来说,其颜色空间(即不同的颜色数目)是224=256×256×256 =16 777 216。为了提高效率,可将颜色空间进行适当的量化,然后再统计每组中对应的像素数目,从而较为简便地获取图像的颜色直方图。

在基于内容的图像查询中,若仅采用上述方式对图像进行索引和检索。因颜色直方图只反映了图像像素的颜色统计分布,并未体现图像的颜色空间分布特征,由此可能导致两张颜色统计分布相同的图像。其空间分布可能差别很大,所以直接将此特征作为图像检索的依据,得到的检索结果将是很粗略的。为了提高检索的准确度,可将整个图像分为多个区域,通过提取各个区域的颜色特征(直方图),并对两张图像分区进行相应的比对,由此判断其相似性,将会显著提高检索的效果。

2 图像区域颜色特征值的提取算法

在基于图像区域颜色特征的相似性匹配算法中,需将每幅图像分成多个区域(区域的数目影响匹配精度和检索速度,下面以划分4个区域为例来讨论),如图3所示。分别提取每个分区的颜色特征,得到各个区域的颜色直方图,如图4所示。然后进行对应分区的相似匹配,根据各区域的相似程度,再综合判断整个图像之间的相似性。

图3 图像分区示意图

图4 图片分区直方图

假设有图像1和图像2,颜色空间量化为16 000,则两幅图像第j个区域(j=1,2,3,4)的颜色直方图特征向量可分别表示为:

CH1(j)=(n1,n2,…,n16 000)

CH2(j)=(n1,n2,…,n16 000)

本文中图像区域颜色特征(直方图)的提取及匹配算法等代码和运行界面全部用C#语言实现。

3 图像相似性匹配的算法

在图像的相似性度量计算中采用欧氏距离法。假设查询用例图像的分区直方图用Gj(g1,g2,…,g16 000)表示;数据库中目标图像的分区直方图用Sj(s1,s2,…,s16 000)表示;j的取值范围为分区的个数(本例为1~4),可以将这两个图像的各分区直方图特征向量看作欧氏空间的两个点,利用欧氏距离来描述相对应区域的相似性,即:

Edj(G,S)=∑Ni=1(gi-si)2

式中:Edj(G,S)的值越接近0,则两幅图像的相应区域越相似。如果两幅图像相应区域的颜色特征完全一致,则Edj(G,S)=0。经过以上分区比对,若大部分区域的相似程度符合要求(预先设定合适的阈值),则可判定两幅图像为相似图像。

4 图像相似性匹配的实例

利用以上算法,可以对任意两幅图像进行基于区域颜色特征的相似性匹配。本实例中将图像(24位*.bmp)尺寸统一为163×122像素(大小约为60 KB),将RGB颜色空间(16 777 216种颜色)量化为16 000组,落在每组的颜色以该组中间值表示,相似性的匹配阈值设为0.07(该值越小查询的精准度越高)。所使用的电脑,CPU为Pentium双核2.8 GHz,硬盘串口80 GB,内存512 MB,网卡10 M/100 M自适应。提取一幅图像的分区直方图花费时间约为130 ms。图5显示了两张花卉图片的读取、分区像素颜色的提取和统计、分区直方图的绘制和比对,以及分区图像相似性匹配的计算和度量,经过综合判断(本例设定相似的条件为相似区域达到或超过半数),最终给出两幅图像相似性的结论。

图5 基于图像区域颜色特征的相似性匹配实例

5 结 语

该文提出一种基于区域颜色特征的图像相似性匹配算法,并用C#语言加以实现。该算法在提取图像颜色统计特征的同时,还考虑了其空间分布,与单纯的考虑颜色特征的图像匹配算法相比,在查准率方面有明显的提高,对改善图像的检索效果有积极的借鉴意义和较强的实用性。

参考文献

[1]庄越挺.网上多媒体信息分析与检索.北京:清华大学出版社,2002.

[2]杨冉.图像数据库相关技术的研究与应用.西安:西安电子科技大学,2005.

[3]徐煜.一种基于内容的多媒体检索与查询语言.南京:河海大学,2001.

[4]王玲.基于内容的WWW图像检索研究.济南:山东师范大学,2004.

[5]刘忠伟,章毓晋.利用颜色特征进行图像检索.电子技术应用,1999,25(2):19-20.

[6]吴波,王保保.几种基于内容的图像检索的方法.计算机技术与发展,2006(6):191-192,195.

[7]求是科技,张宏林.Visual C++数字图像模式识别技术及工程实践.北京:人民邮电出版社,2003.

[8]南泰电脑,吕文达.精通C#程序设计.北京:清华大学出版社,2004.

[9]周长发.精通Visual C++.NET图像处理编程.北京:电子工业出版社,2002.

[10]李大友.图形图像处理技术.北京:清华大学出版社,2004.

[11]Pass G,Zbaih R,Miller paring Images Using Color Coherence Vectors.4th ACM Conf.on Multimedia.Boston:ACM,1996.

[12]Jain A K,Vailyaa A.Image Retrieval Using Color and Shpae.Patern Recognition,1996,29(8):1 233-1 244.

[13]Niblack W.The QBIC Project:Querying Images by Content Using Color,Texture and Shape.SPIE.1993,V1908:173-187.

上一篇:一种基于FPGA高性能H.264变换量化结构设计 下一篇:COBIT在信息系统风险控制中的应用