基于内容的植物叶片图像检索分析

时间:2022-10-13 12:10:40

基于内容的植物叶片图像检索分析

摘 要:本文就保护植物的实际意义出发,介绍了以CBIR技术为中心的植物分类与检索方法,它具有长远的应用意义。简要概述了基于内容的图像检索的关键步骤,着重阐述了基于内容的植物叶片检索国内外研究现状,对其发展趋势做出了展望。

【关键词】植物 基于图像 检索

1 引言

植物几乎围绕于一切人类活动中,是人类赖以生存的坚实基础。首先,人类所必需的氧气靠植物进行光合作用来供给。同时,植物是最主要的食物和能源来源,人类衣食住行中绝大多数是直接或间接来之与植物。据不完全统计,全世界能食用的植物至少有75000种。

现如今,随着人口膨胀,生活污染物与工业废料大量排放、森林被长期过量砍伐,严重破坏了植被的生存环境,继而影响人类的正常活动。《中国珍稀濒危植物》首批公布的388种植物中,濒危物种121种,稀有物种110种,渐危物种157种。植物灭绝随之而来的是粮食短缺、能源枯竭、生态失衡与环境恶化等一系列重大问题。因此,人们意识到保护植物的多样性就是保护人类自己。近几年来,专业人士展开了一系列有力措施对植物进行识别分类研究,建立保存植物物种基因库与数据库,以达到保护濒危植物,维护植物物种多样性的目的。

植物分类与识别的一个方法是测量与观察植物器官上稳定的特征来分辨植物间的差异并进行分档归类。传统的植物鉴别方法由人工文字记录完成,该方法工作效率低,耗时耗力,并且需要相当的经验技巧,存在比较大的误差。在计算机技术高速发展的今天,计算机图像处理技术为植物的分类与检索提供了一种可能的解决方案。尤其是自20世纪90年代起,基于内容的图像检索(CBIR)技术蓬勃发展,已经成为智能信息领域的热点。

2 基于内容的图像检索的植物分类与检索概述

基于内容的图形检索克服了以文字描述植物特征抽象、主观的难点,直接从待检测的植物图像直观的视觉特征出发,在图像数据库中查找相似的植物图像,从而达到“以图搜图”的检索目的。

典型的基于内容的图像检索工作流程是系统对输入的图像进行训练,分析图像集并分类统一建立模型,然后依据各种图像模型提取图像特征存入特征数据库。接着采用相似度匹配算法计算待测图像特征与特征数据库中图像的相似度,从而排列出一系列相似度从大到小的图像反馈给用户。

2.1植物图像特征

常用的图像特征是根据本身的形状、颜色、纹理等低层视觉特征,更高级的是联合基于图像抽象属性(场景语义、行为语义以和情感语义)的特征。植物一般的器官有根、叶、花、果实、种子,可以提取这些器官的图像特征进行分类。但植物的花、根、果实等结构复杂,特征提取困难。植物叶片由于是平面的二维结构,特性稳定,比较容易分析提取其图像特征。其中植物叶片的颜色特征受环境的影响比较大,因此植物分类识别主要依据其叶片的形状特征与纹理特征。

形状特征是植物叶片图像最为直观的基本特征。一般情况下,图像形状特征的描述分为基于边界和基于区域的两种方法。其中边界描述的思想是当一个叶片区域边界上的点确定时,可以利用这些边界点来区分不同区域的形状。基于边界的描述方法主要有边界长度、边界直径、离心率、曲率、链码、多边形近似、标记图和傅里叶形状描述符等。而区域描述是描述构成区域内部所有像素的整体特性。简单的区域描述有区域的质心、区域面积、正交矩(Zernike矩,Legendre矩, pseudo-Zernike矩)、通用傅里叶描述符等。综合的基于全局特性的描述包括狭长度、偏心率、圆形度、球状性和基于内角的特征向量等。

描述纹理的方法可以分为三类:结构法、统计法和频域法。常用的纹理描述的统计方法有灰度差分统计法、灰度共生矩阵法、等灰度行程长度法和纹理谱法等。Tamura[5]等人还基于人类对纹理视觉感知的研究,提出了6个基础性纹理属性,分别是粗糙度、对比度、方向度、线性度、规则度和粗略度。常用的描述纹理结构方法有纹理基元参数法和文法等。常用的描述纹理的频谱方法有傅里叶变换法、小波变换法、Gabor函数滤波法等。

2.2植物叶片图像相似度度量

相似度度量是用于衡量同种类样本的类似程度和不同种类样本的差异程度。图像特征描述子大都可以表示成特征向量的形式。可以把图像特征看似空间上的点,那么点与点之间的联系与其在空间的接近程度相关。点在空间的接近程度则转换为点间的距离来度量。常用的相似度度量方式欧几里德距离、街坊距离、角度相似性函数等。其中欧几里德距离是最简单的距离公式,在基于内容的图像搜索中应用比较较广泛。欧几里德距离越小,表示样本之间越相似。

3 基于内容的植物叶片检索国内外研究现状

尽管基于内容的图像检索是一种新的图像检索技术,代表了其核心技术还不是很成熟。但是,近年来,国内外业界人士纷纷投入了大量的人力、物力探索基于内容的植物图像分类与检索的方法,取得了一定的成果。

在理论研究方面,早在2000年,Z.Wang等提供了一个高效分两阶段的叶片图像检索方法,它是运用轮廓质心距离曲线(CCD) ,偏心距和角度直方图( ACH)轮廓这些简单的图像形状特征来描述的。用该方法对140种植物的1 400片叶片图像进行了测试,对比曲率尺度空间(CSS )和修改后的傅立叶描述符(MFD )搜索结果,大大降低了计算复杂度。JiXiang Du等依据叶片的形态特征提出一种基于移动中位数中心(MMC)的超球分类法,该方法分类精确,不仅能节约存储空间而且分类时间复杂度小。George Gagaudakis等尝试结合基于内容的图像形状中一系列新老的描述方法,根据检索结果分析,找到既省时省力又高效的检索方法。Mohammad Reza Daliri等采纳相邻近似趋进的方法,提出了一种鲁棒性良好的用于识别与检索的图形形状的特征描述子。用该方法对包含15类树叶的瑞士叶片数据库进行训练,识别准确率非常高。Xiao-Feng Wang等解决了复杂背景下的植物叶片图像的分类,把自动标记分水岭预分割算法与形态学特征形结合,然后利用MCH分类器提取高维特征。实验成功归类出20种现实植物叶子,平均分类率高达92.6%。

在应用研究方面,Dong-Ho Lee等设计了一个基于内容的图像形状检索系统。该系统采用边缘检测与波形变换提取图像特征,提供了一个处理超球面的检索算法,促进了检索速率。Zeng Chen[等用支持向量机和决策树组成了新的能自动图像标记的方法。该算法能把目标图像信息转换成文字信息,因此这个系统能够同时根据查询图像与关键字来进行图像检索。实验结果显示该系统算法标记与检索图像的能力比传统的学习算法更优越。Yunyoung Nam等的系统检索方法运用了植物叶片的形状和叶脉特征,提出了一种自适应网格匹配算法。结果显示,该方法图像检索的召回率比CCD、CSSD、MPP方法都要高。

4 总结与展望

基于内容的植物叶片图像检索技术,其涉及了视觉、图形处理、信息检索、人工智能等各个领域的专业技术,是一个热门的有前景的研究方向,该技术的深入发展也大大提高了植物的分类识别速度和正确率。依据上述业界比较成熟的研究者陈述,他们采用的数据集、搜索方法、检验方法多不相同,难以比较不同算法检索图形的性能优劣和鲁棒性。除此之外,自然环境下的植物叶片构成复杂,在实验设计过程中要涉及对图像进行预处理,如叠加叶片的选取、叶片填洞处理、叶柄的去除、噪声滤波等等。总之,如何提高植物叶片检索能力,使其具有高的实际意义和应用价值还有很长的路要走,也是今后业界探索研究努力的方向之一。

参考文献

[[1] 扬州大学网.谈植物与人类的关系[z].

[EB/OL].http:///zonghe/lunwen/2784_1. html ,2010,04,29

[2]郝日明,黄致远等.中国珍稀濒危保护植物在江苏省的自然分布及其特点[J].生物多样性, 2000, 05,8(2):154-162.

[3]唐立军,段丽娟.基于内容的图像检索系统[D].计算机应用研究,2001,18(7):41-45

[4]李聪,基于区域综合特征的图像检索[D],西北师范大学,2009,05

[5]Tamura H, Mori S, Yamawaki T.Texture features corresponding to visual perception[J].IEEE-SMC,1978,8(6):460-473

[6] Saniti S, Jain R, Similarity measures[J],IEEE Transactions on Pattern Analysis and Machine Intelligence,1999,21(9):871-883

作者单位

1.南京财经大学信息工程学院 江苏省南京市 210046

2. 南京财经大学信息工程学院 江苏省南京市 210046

上一篇:Photo shop软件在多媒体创作中的应用分析 下一篇:基于Python的设计模式研究