基于关联规则挖掘的图像检索

时间:2022-08-10 02:31:43

基于关联规则挖掘的图像检索

摘 要:针对图像检索中图像相似性判断所面临的“语义鸿沟”问题,本文提出了基于关联规则挖掘的图像检索。该方法利用数据挖掘技术,对图像纹理的各种低层可视化特征进行分析挖掘,获得一系列的图像低层特征值与高层概念之间的各种规则,将这些规则构成图像知识库,并与概念集合相对应。实验结果表明,采用关联规则挖掘能很好的提高图像检索的准确率。

关键词:数据挖掘;关联规则;图像检索;纹理

中图分类号:TP317 文献标识码:A DoI: 10.3969/j.issn.1003-6970.2012.04.009

基于内容的图像检索系统采用直接从图像中获得的视觉特征如颜色、纹理、形状等来判断图像之间的相似性,这就不可避免地遭遇到“语义鸿沟”问题[1]。实际上,图像检索的用户一般对所要查找的图像有一个大致的理解,通常是建立在图像所描述的对象、事件及表达的情感上,而且图像数据库所涵盖的领域范围很宽泛,那么人工建模的图像库中图像类别的数量将难以令人接受。

目前,基于内容的图像检索技术面临的最大困难是:系统提取出的图像低层内容特征与用户理解的图像高层语义之间存在着几乎不可跨越的“语义鸿沟"。如何在图像检索这一特定的应用领域,缩小图像低层特征和高层语义之间的鸿沟,提高检索准确率一直是研究人员努力的方向。

本文基于机器学习的方法来提取图像的纹理类别特征,并对彩色图像进行归类。这种方法试图通过机器学习从纹理低层特征的表示中,捕捉或者学习人们主观认为的视觉相似性的高层概念,由此提高基于内容的图像检索系统中图像的自动识别能力[2,3]。广。基于数据挖掘的图像语义检索是指利用图像数据挖掘方法,对图像的各种低层可视化特征进行分析挖掘,获得一系列的图像低层特征值与高层概念之间的各种规则,将这些规则构成图像知识库,并与概念集合相对应。在检索时,由用户提交概念查询条件,并将这些查询条件映射到知识库中的具体的规则;然后通过规则解释器对这些规则进行解释,建立规则中的条件与具体的与之匹配的图像特征向量之间的联系,最后从图像库中找到相对应的图像返回给用户。

种现象。人们对于视觉上的纹理研究已经超过了三十年,发展了包括随机场模型和多分辨率技术等,对纹理进行描述和分析的各种技术,在纹理分割、纹理分类、纹理合成等多个方面都进行了有关的研究工作。本文应用纹理作为视觉特征,可以在图像库中检索到感兴趣的相似的图案和目标。

纹理特征是一种不依赖于颜色或亮度的、反映图像中同质现象的视觉特征[8]。它与颜色特征不同,纹理特征体现的是一个区域的属性或是对局部区域中像素之间关系的一种度量,而不仅仅是一个点的特征。对单独的点来说,是不存在纹理属性的。

纹理特征的提取就是将区域特征进行量化,以不同的特征值表示一个区域的纹理特征,为此需要考虑纹理的不同性质。纹理的性质可以分为空间性质、频域性质和结构感知性质三类,所以纹理描述模型可分为基于空间性质的纹理模型,基于频率性质的纹理模型和基于感知性质的纹理模型。

对纹理图像的描述常借助纹理的统计特性或结构特性进行,对基于空域的性质也常可以转换到频域进行处理,所以常用的三种纹理描述方法是:(1)统计法;(2)结构法;(3)频谱法。本文采用的是结构法。

结构方法就是假定纹理模式由纹理基元的空间排列组成,使用模式基元和特定的排列规则来描述纹理[6]。结构法研究的主要内容是基元及其空间关系。基元一般定义为具有某种属性而彼此相连的单元的集合,属性包括灰度、连同区域的形状、局部一致性等。空间关系包括基元的相邻性、在一定角度范围内的最近距离;等等。

将以上的关联规则用于图像检索,其基本思路是,首先计算图像库中所有图像的关联规则并保存,然后将输入图像的关联规则与库中所有图像的关联规则进行相似度计算,选取相似度大的图像做为检索结果[10]。根据此思路,本文将一幅6795×5671的QuickBird影像切割成100×100大小的影像,总共得到3752张影像,以此作为图像库。QuickBird影像的空间分辨率为0.6米,因此切割后每张影像上的地物仍然是完整的,以下是几张切割检索后的实验图片,其中(a)为森林,(b)为居民区,(c)为道路。

在基于纹理特征的图像检索中,使用纹理特征进行检索,往往效果不会很好。主要原因是由于纹理特征的提取、描述和纹理特征相似性测度的计算与人眼对纹理图像的心理感觉还是有一定的差别的。而本文用关联规则挖掘实现图像检索很好的解决这个问题,提高了图像检索的准确率。

上一篇:中国动画亟待彰显民族元素 下一篇:实作的力量