国内图像检索研究知识图谱分析

时间:2022-07-07 12:00:32

国内图像检索研究知识图谱分析

〔摘 要〕汇总统计CNKI全文数据库中近十年国内图像检索领域所涉及的关键词,利用SATI 3.2软件统计这些关键词的词频,确定我国图像研究领域使用频率最高的关键词。然后构造共词矩阵、相关矩阵、相异矩阵,并在此基础上利用聚类分析和多维尺度分析多元统计方法对不同的矩阵进行共词分析。最后,对分析结果进行讨论,归纳国内近十年图像检索研究热点。

〔关键词〕图像检索;共词分析;知识图谱;研究热点

DOI:10.3969/j.issn.1008-0821.2013.11.023

〔中图分类号〕G254 〔文献标识码〕A 〔文章编号〕1008-0821(2013)11-0100-08

图像检索是信息检索的重要组成部分,从20世纪70年代开始,很多学者都对图像检索技术进行研究,先后提出基于文本的图像检索、基于内容的图像检索以及基于语义的图像检索技术。传统的文字搜索主要是以关键词匹配为基础,着重优化搜索路径算法,加强建立学习和反馈模型,比如百度和谷歌都取得了巨大的成功。但图像检索与文字检索存在很大的区别,存在很多问题,如图像内容描述、语义理解鸿沟、特征提取复杂等。这些问题制约着图像检索研究领域的进一步发展,也是图像检索研究的热点问题。

本文以CNKI近十年来发表的图像检索文献为研究对象,以文献关键词为研究载体,以共词分析方法为研究基础,采用聚类分析、多维尺度分析、社会网络分析等方法,结合可视化软件Ucinet,绘制近十年来图像检索研究图谱。笔者研究目的在于通过这篇研究论文,图像检索研究领域的学者或者是对图像检索感兴趣的人可以很清晰的发现近十年来图像检索研究领域过去的关注点、现在的热点以及未来的发展趋势。

1 文献来源及研究方法

1.1 研究文献来源

为了确保检索的文献符合笔者的分析需求,笔者检索条件设置为:数据来源为CNKI(中国学术文献网络出版总库),检索时间为2003-2012年,关键词中包含“图像检索”,检索策略为“精确”进行检索,共检索出期刊2 477篇。

1.2 基于研究样本的文献计量情况

论文载文量的变化,在一定程度上反映该学科的理论水平和发展速度[1]。笔者对国内图像检索相关的2 477篇文献进行统计,并利用Excel软件绘制出图像检索文献年代分布折线图,如图1所示。图1的数据表明,图像检索论文数量从总体上来看,是成上升趋势,在2008年达到顶峰。论文增长曲线呈现“S”型。根据普莱斯逻辑增长曲线规律,笔者发现图像检索研究是逐步发展的,并逐渐走向成熟的过程。图1 2003-2012年图像检索研究期刊发文量

1 通过文献计量软件SATI 2.2软件,对检索的2 477篇文章的文章进行统计分析,得到作者的总人数为3 917人(包括第一作者、第二作者等)。经过计算,笔者发现西安电子科技大学多媒体研究所的周利华教授和河南理工大学的孙君顶教授发表的文章最多,同为33篇,根据普莱斯计算公式,核心作者发文数m≈4.31,因此将文章数量为5篇及以上的著者定为核心著者,统计得到核心著者有153人,占全部作者总数的3.9%。笔者筛选出发文数量排名前20的作者及其单位,如表1所示。从表1中,我们发现图像检索研究机构以高校为主,并且相对集中。西安电子科技大学、西北大学、西北工业大学、河南理工大学等。高校是图像检索的主要研究机构,这也表明,图像检索的研究目前以理论研究为主,实际应用并不广泛。

表1 2003-2012年图像检索期刊发文量前20位作者及其单位

1.3 期刊分析

期刊载文分析主要反映学科研究文献的期刊分布情况,期刊的分布也可验证布拉德福定律。由于核心期刊的载文量水平较高,更能反映学科研究水平,因此本文的期刊分析,都以核心期刊为主。表2是排名前20位发文量超过15篇的核心期刊。

表2 载文前20种核心期刊表

1.4 研究主题分析

研究主题变化通过关键词词频变化来揭示。本文对2 477篇图像检索的关键词进行统计,在统计过程中,对一些关键词进行合并处理,如“基于内容的图像检索”、“基于内容”和“CBIR”;“纹理”和“纹理特征”等。为了能够清晰的揭示出研究主题的变化,笔者对每一年的论文关键词分别进行统计,统计结果见表3。

表3 2003-2012年论文关键词词频变化表

随着时间的推移以及研究的深入,图像检索领域的研究热点也在不断的变化中。笔者参考安徽大学储节旺教授将热点关键词进行分类的研究方法,将图像检索领域的热点关键词分为3种类型:恒星关键词、流星关键词和新星关键词[2]。(1)恒星关键词指的是那些一直处于研究热点的关键词,如“图像检索”、“基于内容的图像检索”、“相关反馈”、“特征提取”、“颜色直方图”等,这类关键词也是图像检索的核心内容。(2)流星关键词指的是那些研究一段时间后缺乏持续研究的关键词,如“图像数据库”、“医学图像检索”、“数字图书馆”等。这类关键词研究的内容深度不够,没有涉及到图像检索的核心内容,研究的是图像检索应用研究。图像检索研究本身存在很多技术有待突破,目前主要停留在理论研究层面,这些基于图像检索技术的应用研究明显研究深度和热度。(3)新星关键词指的是那些总体增长比较平稳并且在未来会受到重点研究的关键词,如“图像分割”、“小波变换”、“支持向量机”、“灰度共生矩阵”等。这类关键词涉及到图像检索的核心技术,也是未来提高图像检索速度和效果的关键所在。

1.5 高频关键词的确定

通过文献计量软件,统计得出2 477篇文章中共有关键词3 463个。通过对关键词进行认真分析,将一些表述相近意思的关键词进行合并,如“基于内容的图像检索”、“CBIR”和“基于内容图像索”;“纹理”和“纹理特征”进行合并,取词频大于20的关键词作为高频关键词,共有48个,如表4所示。表4 高频关键词表(部分)

关键词频次关键词频次图像检索1 190直方图48基于内容的图像检索488基于内容44相关反馈261灰度共生矩阵43特征提取210MPEG-743颜色直方图130数字图书馆37纹理特征94相似度37支持向量机86医学图像检索36颜色特征72图像特征35小波变换71图 像32图像分割65检 索31形状特征58信息检索30相似性度量56图像语义30图像数据库54图像分类29颜 色52颜色空间28聚 类49不变距27

为了进一步的分析关键词内部之间的联系,对48个高频关键词进行两两检索,形成48×48的共词矩阵,如图2所示。图像检索基于内容的

图像检索相关反馈特征提取颜色直方图纹理特征纹 理图像检索1 18910129104814942基于内容的图像检索103876341161916相关反馈12963261238310特征提取1044123210599颜色直方图81168513001图2 高频关键词共现矩阵(部分)

1.6 构造相关矩

通过对共词矩阵进行卡方检验,发现共词矩阵不符合正态分布规律,为了能够用更多的统计方法对数据进行统计分析,需要利用Ochiia系数对共词矩阵进行转换,构造相关矩阵和相似矩阵。用Ochiia系数将共词矩阵转换成相似矩阵,如图2所示。但是相似矩阵中的0值过多,统计时容易造成误差,为了方便进一步处理,用1与全部相关矩阵上的数据相减,得到关键词相异矩阵,部分数据如图3所示[3]。

图像检索基于内容的

在相似矩阵中,数值的大小表明了两个关键词之间距离的远近,数值越大表明关键词之间的距离越近,相关程度越大;数值越小则表明关键词之间的距离越远,相关程度越小。图像检索基于内容的

在相异矩阵中,数值越小表明关键词之间的距离越近,相关程度越大;数值越大则表明关键词之间的距离越远,相关程度越小。

1.7 知识图谱分析

科学知识图谱是显示科学知识的发展进程与结构关系的一种图形。它的悄然兴起,一方面是揭示科学知识及其活动规律的科学计量学从数学表达转向图形表达的产物,另一方面又是显示科学知识地理分布的知识地图转向以图像展现知识结构关系与演进规律的结果。基于社会网络的Ucinet软件,通过构建行动者节点及其联系网络的互动关系,解释社会网络的层次性、等级性、结构性等,并以网络图谱的形式揭示该研究领域的主题热点[4]。图5 关键词共现图谱

分析显示,网络密度为10.95%,中间中心度为19.62%,一致性指数为0.962,上述3个指数表明,关键词共现网络集聚程度不高。其中,图中节点大小由关键词频次决定,线条的粗细,由两个关键词共现的次数决定。线条越粗,表明共现次数越多,反之,表明共现次数越少。节点围绕图像检索、基于内容的图像检索、相关反馈、特征提取形成相对密集的圈层。图5,点的中间中心度排名前15位的分别是图像检索(982.269,1)、基于内容的图像检索(529.658,2)、相关反馈(365.832,3)、特征提取(343.531,4)、颜色直方图(160.999,5)、纹理特征(108.175,6)、支持向量机(95.334,7)、颜色特征(78.884,8)、小波变换(73.287,9)、图像数据库(57.513,13)、形状特征(46.640,11)、相似性度量(45.965,12)、聚类(44.494,15)、医学图像检索(40.030,22)、图像分割(34.788,10),括号内为关键词的中间中心度及频次排序。网络连线的粗细能反映节点的关联度,是识别意义类团的重要特征,如“图像检索——基于内容的图像检索——图像分割——相关反馈——纹理特征”、“图像检索——颜色直方图——颜色特征——兴趣点——颜色量化——特征匹配”、“图像检索——聚类——语义鸿沟——高层语义——图像索引”、“图像检索——特征提取——纹理特征——相似度——图像数据库——医学图像检索——图像检索系统”等。

1.8 多维量表分析

多维量表分析(MDS)是将一组个体间的相异性数据经过MDS转换成空间的构形,且尽可能保留原始数据的相对关系。在SPSS 19中文版中,选择“分析——度量——多维尺度(ALSCAL)”,得到空间二维图,如图6所示。图6 多维尺度分析结果图

从图6可以看出,关键词大体可以分为六大类。第一类,语义图像检索、多媒体数据库、纹理检索、图像匹配、空间关系、高层语义、主色调、纹理谱、位平面、粗糙集、纹理图像检索、商标图像检索、环形颜色直方图;第二类,纹理分析、边缘检测、图像检索技术、图像检索系统、兴趣点、搜索引擎;第三类,视觉特征、半监督学习、相关反馈、流形学习、多示例学习支持向量机、图像检索;第四类,图像特征、不变距语义、语义鸿沟、相似性度量、相似度、图像分类;第五类,数字图书馆、聚类、形状特征、颜色特征、特征提取;第六类,医学图像、图像数据库、医学图像检索、灰度共生矩阵、颜色距、图像语义、MPEG7、图像分割、颜色空间、图像标注等。

2 研究热点分析

通过上文对图像检索研究领域的多维计量分析(知识图谱分析、多维尺度分析)以及关键词词频的变化分析,笔者发现目前国内对图像检索的研究领域比较集中,主要集中在图像检索的算法研究、图像特征研究(如颜色特征,纹理特征,形状特征等)、图像语义研究等。具体分为以下几个方面:

2.1 图像算法研究

图像算法研究是图像检索的研究热点之一,不同的学者从不同的角度提出不同的图像检索算法,来提高图像检索的效果。鲁珂等提出基于支持向量机的理论提出了一种用于图像检索的半监督学习算法[5]。许相莉等提出一种基于粒子群的图像检索相关反馈算法,使得用户对检索目标的理解逐渐清晰,能够有效全面的搜索图片库,同时避免多次反馈造成的算法效率和检索效果之间的矛盾[6]。王崇骏等在IPSM模型对图像的语义分类特征进行描述和提取的基础上,提出并实现了基于高层语义的图像检索算法以及基于高层语义的相关反馈算法[7]。李健提出一种以曲波变换为基础,综合香农熵与频域子带能量特征的图像检索算法。该方法用香农熵进行预分类,用子带图像的能量特征进行相似度度量,并加入检索者的反馈信息,实现图像的精确检索[8]。牛蕾等回顾了早期的启发式相关反馈算法和近期的最优相关反馈算法,对现有的相关反馈算法进行了分析、总结和对比,并提出了今后相关反馈算法的发展方向[9]。因限于篇幅,不一一列举图像检索算法。

2.2 图像特征研究(颜色特征、纹理特征、形状特征、空间关系特征等) 特征提取是计算机视觉和图像处理中的一个概念,是图像检索的核心内容。它指的是使用计算机将图像信息进行分解、匹对,决定每个图像的点是否属于一个图像特征。特征提取的结果是把图像上的点分为不同的子集,这些子集往往属于孤立的点、连续的曲线或者连续的区域。目前,特征提取算法各种各样,算法计算复杂性和可重复性也非常不同。颜色特征是一种全局特征,描述了图像或图像区域所对应的景物的表面性质,由于颜色特征不能反映颜色信息的空间分布等特点,因此基于颜色特征的图像检索存在一定的缺陷,影响图像检索效果。王向阳等提出一种鲁棒的多特征彩色图像检索新方法,实验结果表明,该方法不仅能够准确、快速的检索出用户所需图像,而且对光照、锐化、模糊等噪声攻击均具有较好的鲁棒性[10]。纹理特征也是全局特征,它和颜色特征不同,纹理特征不是基于像素点的特征,它需要在包含多个像素点的区域中进行统计计算,这样提高了模式匹配的成功率,但光照、反射情况对图像检索存在一定干扰。安志勇等在构造了具有旋转、平移和尺度不变的纹理特征的基础上,提出基于纹理特征的图像检索算法,该算法具有旋转、平移和尺度不变性,与其它方法相比,具有较高的检索率[11]。形状特征有两类表示方法:一类是轮廓特征;另一类是区域特征。图像的轮廓特征主要针对物体的外边界,而图像的区域特征则关系到整个形状区域。形状特征可以比较有效地利用图像中感兴趣的目标来进行检索,但图像形状本身存在容易出现变形的情况,而且人的主观意识对图像形状的判别也存在影响。何姗等提出一种基于兴趣点的图像检索新方法ACSM,利用兴趣点的位置信息,提取兴趣点周围局部区域的颜色矩特征和区域形状不变矩特征,由于将颜色和形状特征有机结合,ACSM算法有效提高了图像检索的准确性[12]。空间关系,是指将一幅图像进行分割,分割出来的多个目标之间的相互的空间位置或相对方向关系(邻接、重叠等关系)。空间关系特征的使用可加强对图像内容的描述区分能力,但空间关系特征常对图像或目标的旋转、反转、尺度变化等比较敏感。张伟等构造了在平移缩放旋转下保持不变的基于度量矩阵特征值的图像空间关系描述子。研究表明这种描述与人的主观视觉心理相一致,在平移缩放旋转下以及小噪声下具有较强的鲁棒性,具有较好的类别可分离性[13]。

2.3 图像语义研究

图像语义研究是图像理解的重点和难点,在现实生活中,人的视觉特征因人而异,人对同一副图像的情感认知也不尽相同,导致不同的人对同一副图像特征提取出现天壤之别。如何对一幅图像的特征(颜色、纹理、形状等)描述与视觉特征相吻合,进行客观的语义描述,实现基于语义的图像检索是国内学者研究的热点之一。图像语义研究包括语义鸿沟、高层语义、底层特征语义等角度。语义鸿沟是图像检索系统广泛存在的问题之一,它是人对图像相似性的判别依据与计算机对相似性的判别依据之间的不同,造成了人所理解的“语义相似”与计算机理解的“视觉相似”之间的“语义鸿沟”的产生。张菁等针对相关反馈和感兴趣区检测在弥补语义鸿沟时存在主观性强、耗时的缺点,提出了视觉信息是一种客观反映图像高层语义的新特征,基于视觉信息进行图像检索可以有效减小语义鸿沟[14]。高层语义主要涉及图像的场景语义、行为语义和情感语义。一般而言,高层的图像语义往往建立在较低层次的语义获得的基础上,并且层次越高,语义越复杂,涉及的领域知识越多,也是图像语义描述的难点之一。吴楠等利用图像的高层语义信息来进行图像检索,在深入研究图像高层语义的低层特征描述的基础上,提出了图像语义的层次划分,并对每个高层语义层提出了语义抽取和检索算法。该检索算法可以有效地对图像高层语义信息进行提取,并可作为新型高效图像检索系统的一个模型[15]。袁薇等指出了应用图像的高层语义特征和底层颜色特征作为图像检索的综合指标,将图像文本和视觉信息融合起来,给出了一种综合语义和颜色特征的图像检索系统的体系架构,以填补多媒体底层特征和高层语义之间的差异[16]。

2.4 图像检索技术研究

图像检索技术的发展是一个不断进化的过程,最初是基于文本的图像检索。基于文本的图像检索是首先对图像的特征进行文本描述,然后利用关键词进行检索图片,费时费力,而且检索效率低下,容易出现错误。为了克服基于文本的图像检索的局限性,提出了基于内容的图像检索系统,通过特征提取和高维索引技术进行检索,通过比较视觉特征的相似度来获得检索结果。洪俊明总结了图像数据库检索技术的发展轨迹和特点,针对基于内容的图像检索技术中的局限性,从计算机底层硬件的角度提出了基于内容检索的流水索引法[17]。但在现实生活中,人们往往习惯于对图像的语义进行检索,而不是图像的特征,如何建立从图像的低层特征到高层语义的映射,获取图像的语义概念,并在此基础上进行语义检索,是图像检索技术的一个新的方向,即基于语义的图像检索技术。陈久军等提出图像语义检索整体框架,系统采用XML技术,将图像内容层式描述、图像语义对象自动获取、图像语义相似测度等功能模块加以融合,实现语义层面的图像检索[18]。

3 结 语

国内对图像检索的研究热点主要集中在图像检索的算法研究、图像特征研究(如颜色特征,纹理特征,形状特征等)、图像语义研究等。当然,国内针对图像检索研究的热点还有,比如基于流行学习的图像检索技术、遗传算法、粗糙集理论在图像检索中的应用以及医学图像检索相关技术的研究等等,因限于篇幅,笔者主要列出国内学者研究比较集中的热点问题。通过共词分析法来展现国内图像检索研究的学科热点问题,这类文献基本没有。笔者的目的在于通过这篇研究论文,图像检索研究领域的学者或者是对图像检索感兴趣的人可以很清晰的发现近十年来图像检索研究领域过去的关注点、现在的热点以及未来的发展趋势。本文在研究过程中,也存在不足。在介绍图像检索研究热点问题,因限于篇幅,很多相关热点没有一一展示;在文献选取时,以期刊为检索源,忽略了硕博士论文,对研究结果会有一定的影响;高频关键词的设定、多维量表分析、知识图谱分析等都具有一定的主观性,这些问题是笔者下一步需要完善的地方。

参考文献

[1]张玉双.我国高校图书馆知识管理研究的文献统计分析[J].晋图学刊,2008,(5):45-48.

[2]储节旺,王龙.近十年国内知识管理研究热点——基于CSSCI数据库的词频分析[J].情报科学,2011,(9):1425-1429.

[3]Manfred Wettler.Reinhard Rapp Computation of Word Associations Based on the Co-occurrences of Words in Large Corpora[EB/OL].2005-10-09.

[4](美)林顿·C·费里曼.社会网络分析发展史[M].张文宏,刘军,王卫东,译.北京:中国人民大学出版社,2008:2-3.

[5]鲁珂,赵继东,叶娅兰,等.一种用于图像检索的新型半监督学习算法[J].电子科技大学学报,2005,(5):669-671.

[6]许相莉,张利彪,刘向东,等.基于粒子群的图像检索相关反馈算法[J].电子学报,2010,(8):1935-1940.

[7]王崇骏,杨育彬,陈世福.基于高层语义的图像检索算法[J].软件学报,2004,(10):1461-1469.

[8]李健,牛振山.基于曲波的纹理图像检索系统的设计与实现[J].计算机工程与科学,2011,(3):62-66.

[9]牛蕾,倪林.基于内容的图像检索中的相关反馈算法[J].计算机工程与应用,2004,(32):65-70.

[10]王向阳,芦婷婷.一种鲁棒的多特征彩色图像检索新方法[J].中国图象图形学报,2007,(10):1757-1760.

[11]安志勇,曾智勇,赵珊,等.基于纹理特征的图像检索[J].光电子·激光,2008,(2):230-232.

[12]何姗,郭宝龙,洪俊标.基于兴趣点颜色形状特征的图像检索方法[J].微电子学与计算机,2006,(3):40-43.

[13]张伟,何金国,桑佩罗布.基于度量矩阵特征值的图像空间关系描述[J].计算机应用研究,2010,(11):4376-4378.

[14]张菁,沈兰荪,David Dagon Feng.基于视觉感知的图像检索的研究[J].电子学报,2008,(3):494-499.

[15]吴楠,宋方敏.一种基于图像高层语义信息的图像检索方法[J].中国图象图形学报,2006,(12):1774-1780.

[16]袁薇,高淼.综合语义与颜色特征的图像检索技术研究[J].微电子学与计算机,2006,(10):36-39.

[17]洪俊明.基于内容检索的图像数据库流水索引法的研究[J].电子工程师,2008,(11):42-45.

[18]陈久军,肖刚,盛颂恩,等.XML驱动的图像语义检索研究[J].中国图象图形学报,2007,(10):1770-1773.

上一篇:产业集群情境下企业资源整合过程研究 下一篇:唯物主义历史观还是人道主义历史观的争论