基于颜色特征的图像检索技术研究

时间:2022-05-15 07:00:13

基于颜色特征的图像检索技术研究

摘要:基于内容的图像检索技术已经成为近年来研究的热点。颜色是基于内容的图像检索的最重要特征之一。常用的颜色特征提取和表达方法是颜色直方图。但颜色直方图只能衡量颜色在全局分布上的差异,丢失了其空间位置信息,影响图像内容相似性的判断和图像检索效果。文章研究的方法是在颜色直方图的基础上进行改进,提出基于分块的主色矩阵检索方法,增强了直方图反映颜色空间分布的能力,使用户可以选择感兴趣区域并调整权重系数并对不同分辨率的图像进行检索前的预处理,减小计算复杂度,提高系统运行效率,节省存储空间。

关键词:CBIR;颜色特征;主色矩阵

中图分类号:TP37 文献标识码:A文章编号:1009-3044(2010)09-2223-04

Research on Image Retrieval Technology Bases Color Feature

LIANG Jing

(Fujian Communication Professional Technology College, Fuzhou 350007, China)

Abstract: Color is one of the most important features for content-based image retrieval, which is easy to perceive. Color histogram can reflect basic color and statistical distribution perfectly. However it can only measure the distribution of color in the overall differences without measuring spatial location information..In this paper, author proposes an improved method called dominant color matrix based block which can enhance the main color of images and dim secondary color. It can capture the color spatial location relationship in order to enhance the spatial distribution of color histogram.Though resolutions of different pretreatment, it can reduce the computational complexity, improve the operating efficiency and save storage space.

Key words: CBIR; color feature; dominant color matrix

随着多媒体和网络技术的迅速发展,涌现出了大量的媒体信息。传统的图像检索技术是基于文本的图像检索,但随着图像信息量的几何级增长,其局限性也越来越明显:1) 对图像加注文本信息由手工完成,随着图像数据来源日益广泛,这种方法显得费时费力;2) 文本描述信息是非常主观的,不同的人对同一幅图像数据可能有不同的理解,因此当用户在查询时输入的关键词和数据库中的关键词不一致或这些关键词根本就不存在时,将导致查询的失败;3) 区区几个关键词很难将图像所反映的内容描述清楚;4) 由于媒体信息分布在Internet网络环境中,不同国家不同民族很难用同一种语言对图像进行加注标识,而且对图像语义理解的差异很大。

可见传统的基于文本的图像检索技术已经越来越无法满足人们的需要,迫切需要人们提出性能更加完善的图像检索技术来解决问题。因此,基于内容的图像检索技术应运而生。文章将基于颜色特征的图像检索作为文章的研究重点,是对图像检索技术的进一步学习与探讨,将具有重要的学习意义和应用前景。

1 颜色空间

1.1 颜色空间的选择

恰当的颜色空间的选择是实现基于颜色特征的图像检索的基础。常见的有RGB颜色空间和HSV颜色空间。一般情况下获取的图像都是在RGB空间描述的,但是RGB空间结构并不符合人们对颜色相似性的主观判断,而HSV颜色空间由色调(H)、饱和度(S)、亮度(V)三个分量组成,与人眼的视觉特性比较接近。从人的心理感知来说,HSV空间要比RGB空间更直观,更容易接受。因此,为了更符合人眼的视觉特征,经常需要做颜色空间的转换,将RGB颜色空间转换为HSV颜色空间,转换公式如式1。

max=max(r,g,b)min=min(r,g,b)

色度值为:

饱和度为: (1)

明度值为:v=max,上式中,r,g,b[0,1],转换后的h[0,360°],s,v[0,1]。

1.2 颜色空间的量化

为了节约存储空间和减少计算复杂度,可以对HSV 空间按照人的颜色感知进行非等间隔的量化。亮度对人的视觉来说,差别是非线性的。人的视觉系统对色调比对饱和度与亮度敏感。因此,可以采取如下的量化策略:1)按照人的视觉分辨能力,可以把色调H空间分成8份,饱和度S和亮度V空间分别分成3份;

2)根据色彩的不同范围和主观颜色感知可以对饱和度及亮度进行不等间隔的量化,量化公式如式2所示。

3) 构造一维特征矢量。按照以上的量化级,把3个颜色分量合成为一维特征矢量,如式3所示:

L=QSQVH+QVS+V

其中,Qs和Qv是分量S和V的量化级数,这里取Qs=3,Qv=3。因此,式3可以转换为:

L= 9H+3S+V (4)

这样,H,S,V三个分量在一维矢量上分布开来。根据式4,L取值范围为[0,1,...,71],经过量化,可有效减少计算量,并减弱图像受光照强度的影响。

2 基于颜色特征的图像检索系统算法研究

由于子图像的划分能够比较简单的利用空间位置的性质,因此可以借鉴传统图像分块的方法,对图像的分块进行改进,在利用颜色直方图统计图像颜色组成的基础上,进一步融入图像的空间信息,可以通过图像分块及权重赋值融入图像的空间信息,而且可以进一步实现基于颜色特征的局部区域检索。具体算法求解如下:将目标图像平均划分为16个子块,求出每个子块的直方图;对于分块的颜色直方图利用加权法求出每个子块的颜色信息,把加权的结果作为该分块的主色信息。将4×4主色矩阵作为该图像的颜色特征,在很大程度上减少了计算量和节约存储空间,但是还没有很好的解决直方图无法体现空间位置的问题。因此,从人眼识别图像的特点出发,可以由用户进行感兴趣区域的选择及权重系数的调整操作。同样的,对数据库中的目标图像也可以采取同样的处理方法。即对数据库中的目标图像也按照4×4的分块方法,构造各分块直方图,根据直方图提取出主色信息,构造主色矩阵。最后,根据用户调整的权重系数,按照式5计算示例图像和数据库中目标图像的距离,将距离从小到大排序,距离越小则图像越相似。两幅图Q,P的距离计算公式式5所示。

其中,Qi和Pi分别为查询图像和目标图像的主色矩阵中相应元素值,Wi为各个分块的权值系数。

3 基于颜色特征的图像检索系统的设计与实现

3.1 系统体系结构

基于内容的图像检索系统可以采用如下架构:用户通过选择具有代表性的一幅示例图像构造查询,通过系统查找与示例图像在视觉内容上较为相似的图像集,按照相似度大小排列返回给用户。文章设计图像检索原型系统MyCBIR,以实现基于内容的图像检索,系统框架图1所示。

3.2 系统界面与测试

系统界面与测试如图2~图5所示。

3.3 实验数据及结果分析

将检索结果由视觉特征的相似性转化为可以进行具体比较的数据,这里采用图像检索系统常用的两个主要性能指标:查全率和查准率。查全率的主要含义是在一次查询过程中,系统返回的查询结果中的相关图像的数目占数据库中所有相关图像数目(包括返回的和没有返回的)的比例,即:

Pm= ns/n (6)

其中ns为检索到的相关图像数目,n为所有相关图像数目。

而查准率主要指在一次查询过程中系统返回的查询结果中的相关图像的数目占返回图像数目的比例,即:

Pn=ns/nr (7)

其中ns为检索到的相关图像数目,nr为检索出的全部图像数目。

查全率是检索系统查找用户所需信息能力的标志,查准率则从一个方面描述了检索系统的查询开销,反映出了系统检索效果的准确程度,一个良好的检索系统,能够保持较高的查全率和查准率。

实验中所采用的图像来自于Corel数据库的1万幅图片,这些图片在内容上有很大差异,可以保证实验结果的客观公正,分别采用直方图相交、欧式距离、主色矩阵三种算法进行测试。实验结果表1所示。

表1 三种检索方法的比较结果

根据表1所示的实验结果,上述实验结果选择五组完全不同类型的图片,采用三种不同的算法进行检索,可以看出对于蝴蝶、汽车这两组实验,采用主色矩阵检索方法,检索结果的查全率和查准率均有明显提高,查全率分别提高了7%和15%,查准率则提高了8%和19%,很明显,主色矩阵的检索效果较为理想;对于游艇、花这两组实验,直方图相交和主色矩阵检索的查全率和查准率相当,为此,除了实验数据的比较,还可以再用人眼视觉对检索效果进行衡量,由于检索出的结果是按照检索方法判断的与示例图像的相似程度进行排列返回,比较图3与图5,可以明显看出,对于直方图相交检索方法,前10幅才检索出了与示例图像相似的全部游艇图片,其中有3幅是不相关的图片,而主色矩阵的检索方法,前7幅就检索出了所有与示例图像相似的全部游艇图片,其中只有1幅是不相关的图片;与欧式距离检索方法进行比较,主色矩阵检索效果的查全率与查准率均高于欧式距离的检索结果,因此,可以认为主色矩阵的检索方法具有较好的检索效果。然而,对于建筑这一组实验,主色矩阵检索方法的查全率和查准率较低,效果不如直方图相交和欧式距离的检索方法。

从实验数据的比较,可以看出:从视觉效果上看,当一幅图像中有出现明显的主体对象时,主体对象颜色相似的图片容易被人眼认为是相似的图片。用直方图相交和欧式距离的检索方法强调的是颜色的整体组成,对于图像中的所有区域的颜色都平等对待,没有将主体对象和背景区域的重要性区分开来,无法突出体现主体对象的颜色信息,不符合人眼观察图片的视觉特性。在主色矩阵的检索方法中,对图像进行了分块处理,通过分块,融入了位置信息,使图像在进行搜索时,不仅实现颜色组成上的相似性,还能体现空间位置上的相似性,提高了检索的准确度。通过人机交互的界面,用户能够根据自身的视觉关注度选择感兴趣的关键区域,能够对关键区域进行权重调整,使检索过程更符合人眼的视觉特性。而当人眼无法观察出特别明显的主体对象,对于感兴趣的关键区域的确定也就比较模糊,如果主体对象形态差异较大,那么颜色的空间分布也就具有较大的差异,颜色的空间位置信息用分块的方式进行定位可能造成较大误差。因此,对于感兴趣区域的选择及系数的调整反而可能对颜色信息的匹配造成干扰,对实验结果造成不利影响。因此,对于背景图,主色矩阵的检索效果不够理想。

根据上述实验结果的分析,可以得出如下结论:1) 基于内容的图像检索系统,采用人眼最容易感知的颜色作为图像特征进行提取和匹配是可行的,且能够取得较好的检索效果。2) 对于同一幅图像,采用不同的检索方法,能够检索出不同的结果。不同类型的图片,适合不同的检索方法:当图像中有明显的主体对象出现时,主色矩阵的检索方法能够突出主体对象的颜色特征,符合人眼判别相似性的视觉特性,具有较好的检索效果;当图像没有明显的主体对象,或者主体对象占据了图像大部分区域,或者主体对象的颜色与背景区域十分相近时,从人眼的视觉效果看,对感兴趣区域的判断较为模糊,人眼此时更为关注图像的整体颜色信息,那么基于整体颜色分布的直方图相交和欧式距离的检索效果会更好。

本论文围绕基于颜色特征的图像检索方面进行研究。可以预见,随着多媒体信息处理、数据库和计算机网络技术的相互融合发展,针对基于内容的图像检索技术的深入研究,将具有更大的理论价值和广泛的应用前景,其成果对于信息产业的进一步发展将起到积极的推动作用。

参考文献

[1] 肖明,王永红,石勇.基于内容的图像检索研究进展[J].情报杂志,2007(1):43-45.

[2] 徐庆,杨维维,陈生潭.基于内容的图像检索技术[J].计算机技术与发展,2008(1):126-128.

[3] 陈栋梁,周晓君.基于内容的图像检索技术研究[J].计算机与数字工程,2006(35):140-142.

[4] 李岚,冯刚.MPEG-7与基于内容的图像检索[J].计算机工程与应用,2002(17):98-102.

[5] 吴志红.基于内容的图像检索技术及应用[J].计算机与网络,2006(1):197-198.

[6] 梁艳.基于内容的图像检索技术及应用[J].科技信息,2008(20):51-52.

[7] Hafner J, Sawlutey H.Efficient color histogram indexing for quadratic form distance functions[J].IEEE Trans. on Pattern Analysis and Machine Intelligence,1995,17(7): 729-736.

[8] Stricker M , Orengo M. Similarity of color images.IS & T/SP IE Conf. on Storage and Retrieval for Image and Video Databases III,1995,24(2):381-392.

[9] Wan X, Kuo C C J. A new approach to image retrieval with hierarchical color clustering, IEEE Trans. On Circuits and Systems for Video Technology,1998,8(5):628-643.

[10] Pass G, Zabih R, Miller J. Comparing Images Using Color Coherence Vectors ACM Multimedia,1996(11):65-73.

上一篇:Borland C++Builder响应Windows消息机制的分析 下一篇:基于.NET的高职院校干部测评系统设计与实现