基于内容的图像检索(CBIR)中图像颜色特征提取方法的研究和改进

时间:2022-10-17 05:58:22

基于内容的图像检索(CBIR)中图像颜色特征提取方法的研究和改进

摘要:该文给出了一种基于颜色分布直方图借助四叉树图像分割进行图像检索的方法,该方法使用与人类视觉感知相符合的HSV颜色模型,通过构造四叉树借助MeanShift算法对图像进行分割,提取出特征颜色,得到颜色分布的直方图。最后利用EMD算法衡量图像与图像之间的距离,实现图像的搜索。

关键词:基于内容检索;均值漂移;四叉树;图像分割;特征颜色

中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2014)11-2642-05

Abstract: The paper presents a method for image retrieval with the aid of image segmentation. This method is based on color distribution histogram and uses the HSV color model which is consistent with human visual. With the help of MeanShift Algorithm, we use quadtree to divide the image and extract the main color, which is helpful for us to get the distribution of color histogram. Last but not least we use the EMD algorithm to measure the distance between images, so that we can implement the image search.

Key words:CBIR; meanshift; quadtree; image retrieval; main color

随着网络和多媒体技术的发展,以及数字图像的大量应用和存储空间成本的降低,数字图像的数量正在飞速的增张,从而催生了基于内容的图像检索(Content-Based Image Retrieval,CBIR),在电子商务[1],医学[2]等方面产生了各种优化和改进的算法。在一幅图像中,颜色是最主要的特征,且颜色具有与生俱来的旋转不变性和尺度性,对大小和方向都不敏感,有很强的鲁棒性,因此颜色可以被用于图像检索。常见的检索方法包括Swain等人提出的基于颜色直方图相交的方法,为了加强空间分布信息,改进的方法包括:使用累加直方图的检索算法[3],分块主颜色的图像检索算法[4]。但是这些方法都注重强调的是图像颜色直接特征,而没有考虑人的视觉感受,人们的视觉会自动将相似颜色归类,区域分布也会影响颜色的实际感受。

传统的图像分割技术包括基于阈值的分割方法、基于区域的分割方法、基于边缘的分割方法以及基于特定理论的分割方法等,这些分割方法容易产生较精确的边缘,但实际上对颜色来说,这些精确的边缘并不重要,设置一些噪声会对实际的图像内容解释产生一些偏差。我们将特征空间聚类和基于区域的方法结合起来,提出了基于四叉树分割图像的办法,将图像的颜色以一种快速的方式按照大小不同的矩形进行划分,提高了执行效率,也减小了噪声的干扰。

1 算法的基本思路

首先我们将图像的颜色值从RGB空间转换到HSV空间以符合人眼的视觉模型,然后再对图像利用四叉树进行分割,其中以Mean Shift均值漂移作为是否分割区间的判断标准。分割完成后对图像直方图进行统计,得出多个颜色特征值以及其权重。最后进行图像检索时,通过EMD距离计算这些特征值之间的相关程度从而找出语义上最近似的图像。算法的整体框图如图1所示。

1)色彩空间变换

传统的统计直方图是按照色相这个值来将整幅图像转化为一维的直方图。虽然在这样一个直方图上相邻的组在色相上互相接近,但是没有考虑亮度和饱和度对人类视觉的影响。在同样的色相值的前提下,亮度过高,人类的视觉会把它辨认为白色,而饱和度过低的话,人们会把它辨认为灰色,所以我们对直方图统计做了一个改进。

首先将图像从RGB空间转化为HSV空间。依此遍历处理图像中的每个像素点,主要分析其色相,划归到相应的H中,再计算同样H的所有像素点的S和V的平均值[S]和[V],以H[S][V]的值对应的颜色作为代表颜色绘制出来,更符合人类视觉。2)图像的分割

我们不直接使用颜色直方图作为我们获取图像颜色特征的依据,是因为颜色直方图丢失了图像的空间信息, 为了要寻找出直方图中的特征值,我们利用四叉树对图像进行了分割,对图像中的颜色根据空间信息重新修正,并离散化以得到相对独立且明显的颜色特征。

四叉树分割的流程如下:首先设置一个迭代层数k,我们将最多的对图像实施k次分割。我们将按照如图2所示的流程来完成对图像的分割。设置两个队列,一个是待合并队列,另一个是待分裂队列。我们先将原始图像作为窗口放入待分裂队列。然后重复以下步骤直到满足K层的迭代深度。

检测分裂队列,对选定的窗口进行划分(初始窗口是原始图像)让图像分为上下左右四个等份,并将它们标记为当前窗口的孩子。我们需要检测这几个子窗口中是否有一个区域中颜色一致,如果有,那我们就将它们称为确定的目标区域,不再需要对其进行分割,并放入下一轮的合并队列,以该父区域的特征颜色作为其特征颜色。最后把余下的子窗口放入下一轮的分裂队列。

检测合并队列,如果队列非空,说明有目标区域,因为按照之前的四分窗口的方法,可能出现同一个对象被分在了两个窗口的情况,所以需要对两个相邻的目标区域检测是否满足合并的条件。如果两个区域特征颜色相近,那么我们就可以把两个区间合并为一个新的确定区域。

如果目标区域是一个很小的区域,但旁边有个很大的目标区域。我们在对他们进行合并操作的时候,就需要检测两者的根节点。从而让同属同一个对象的区域能够自动合并到父亲区域中。

交替处理这两条队列,最后,就可以得到整张图像的区域划分结果。

由于采用了四叉树的结构,时间复杂度将会大大降低,特别是对于颜色较少的纯色图像,将会获得更快的划分结果,并且这会将大多数的噪声消除。最终分割出来的结果也将会是色块构成的图像。我们需要的颜色信息在划分的过程中已经完成了统计,故最终我们会得到按照区域面积度量的颜色分布直方图。

3)Mean Shift算法:

如何在一个窗口中找出是否含有目标的子区域,我们采用的是Mean Shift聚类算法[6]。Mean Shift是一种非参数化的多模型分割方法,它的基本计算模块采用的是传统的模式识别程序,即通过分析图像的特征空间和聚类的方法来达到分割的目的。它是通过直接估计特征空间概率密度函数的局部极大值来获得未知类别的密度模式,并确定这个模式的位置,然后使之聚类到和这个模式有关的类别当中[5]。

这里利用局部最大值的点来判断何处的区域为可能的目标区域。我们首先通过提取窗口中心颜色的值,然后从之前的颜色直方图中找出对应的亮度和饱和度信息还原出图像的颜色信息。通过几次Mean Shift的均值漂移,若漂移距离超过阈值,则可认为从中心到新的局部极大值点中存在着一块密度上升的脊线,而且这个区域可以基本覆盖整个子区域。

4) 特征值的提取

由于图像按照四叉树分割,从而原来随着区域面积连续变化的颜色直方图被离散化,颜色直方图上一个个波峰就得以被分了开来而这一分开的依据就是颜色的空间信息。原来两个波峰相连的颜色实际上可能只是两个对象的边缘颜色,虽然可能面积很大,但是人类还是会将它们有选择的忽视。这就是我们的算法的另一个优势。将直方图分成零星的几个柱之后,我们可以将每个柱群看作是一个颜色特征,它具体的值由最高峰来决定。

最后我们从这些柱群中挑选值最大的几个作为该图片的颜色特征值。

3.2 图像检索

我们随机选取了108幅图像组成的数据集来对提出的算法进行检验。给定一幅原图像后,计算所有图像与之的EMD距离,设定一个图像相关的阈值,并对结果进行分析。

这几组实验结果证明,我们所提出的这种算法总体上均优于累加直方图加权距离法。虽然在和基于分块主颜色方法比较的时候,查全率较低和较高的部分表现的有些不理想,但是在0.5以上的查全率的时候,随着查全率的升高,查准率还能稳定在一个较高的水平,具有较高的稳定性。

4 结束语

本文针对颜色直方图丢失颜色空间分布信息的缺点,提出了一种通过将图像进行四叉树划分的方法对颜色进行聚类分割的方法。为了突出一幅图像的主体部分(人们最感兴趣的部分) ,设计了一种包含颜色优化的图像分块方法,再根据量化后的几种颜色信息构造图像的颜色特征,并给出了相应的图像内容相似度计算方法。实验表明,该方法简单、有效,通过利用颜色的空间分布特征能够更加灵活、准确地表示图像主体内容的特征,从而提高了图像的检索精度。

参考文献:

[1] 姚琪,蒋达央.电子商务中基于内容的商品图像检索技术研究[J]技术研究,2013(7);74-76.

[2] 王如杰.基于特征融合的医学图像检索[D].南京:南京理工大学,2013:1-2.

[3] Montiel E. Texture Classification via Conditional Histograms[J]. Pattern Recognition Letters, 2005, 26(11):1740-1751.

[4] 林克正, 张彩华, 刘丕娥. 基于分块主颜色匹配的图像检索[J].计算机工程, 2010, 36(13):186-188.

[5] Fukunaga K, Hostetler L. The estimation of the gradient of a density function, with applications in pattern recognition[J]. Information Theory, IEEE Transactions on, 1975, 21(1):32-40.

[6] Comaniciu D, Meer P. Mean shift:A robust approach toward feature space analysis[J]. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 2002, 24(5): 603-619.

[7] Pele O, Werman M. Fast and robust earth mover's distances[C]//Computer vision, 2009 IEEE 12th international conference on. IEEE, 2009:460-467. [8] Smith J R, Chang S. Querying by color regions using the VisualSEEk content-based visual query system[J]. Intelligent multimedia information retrieval, 1997, 7(3):23-41.

[9] http://wang.ist.psu.edu/docs/related/(test database used in SIMPLIcity paper)

[10] 茹芳, 冀小平. 基于内容的图像检索技术研究[J]. 科技情报开发与经济, 2008, 18(30):153-154.

上一篇:浅析山区节水工程措施模式与应用技术 下一篇:浅谈地下防水施工质量的控制措施