基于文本的图片搜索引擎的研究

时间:2022-10-26 01:53:31

基于文本的图片搜索引擎的研究

摘 要:当前图片应用及其搜索技术越来越成熟,图片检索系统也随之得到了广泛的应用。文中基于上述背景首先对图片信息的技术、文本图片检索系统进行了探讨,接着对文本的图片搜索引擎系统的评价完成了简要概述,最后对组成系统架构以及系统应用测试进行了阐述,这一研究对信息检索技术具有一定的参考价值。

关键词:图片应用;搜索技术;文本图片;搜索引擎;系统评价

目前的Internet应用已经取得了长足的发展,随着网络带宽和终端计算能力的不断增强,图片被越来越多的应用于内容的表达和信息的承载。图片的信息是指图片的内容所表征的意义,这种的信息承载方式与传统的文本的信息是不一样的。由于文本的直观性和简单性,文本的信息即包含于本身;而图片的信息可以通过图片本身的内容传达出来,也可以通过相关文字的描述传达出来,于是图片便有了双重的信息载体。本文基于这一方向,对文本的图片搜索引擎完成了探讨,这一研究对信息检索技术具有一定的参考价值。

1 图片信息的技术

获取图片信息的技术可根据其来源的载体类型划分为基于内容与基于文本这两大类。前者是将单纯的图片内容作为分析与查找对象,而后者则是对与图片有关的文字信息进行分析,其工作方式与以往的文本查找方式差不多。

由于互联网具有边缘化这一特点,其信息组织相当自由,许多图片资料根据方式与风格的差异被组织到各不相同的地方。可根据各种方式自由的对文字与图片进行安排。然而统计数据显示,许多组织方式存在着一些共同点,这些共同点也反应了我们在获取信息方面的习惯。从而无限制的信息提取框架就有可能实现了。互联网上的图片与文本通常都是以组合的形式出现的,其中,HTML网页是我们见的最多的一种组织形式,因此,许多与图片相关的信息于可利用HTML挖掘来获取。

在网页中,HTML网页的应用是最为广泛的,对搜索引擎而言,它也是一个最重要的信息获取途径。互联网上拥有大量的HTML网页和多媒体资源。

在互联网上,Web搜索引擎技术已得到了广泛的引用,每日需抓取不计其数的HTML网页,这是一个非常有价值的资源库,然而,现在只有文本信息被用于Web搜索。若将资源库中的价值充分挖掘出来,则可实现图片、MP3以及Flash等多个搜索系统的建立。所以,我们就从通过对HTML网页的充分利用来创建Web图片搜索引擎开始。

2 文本图片检索系统探析

2.1 检索系统应用涉及领域

如今,图片应用及其搜索技术越来越成熟,图片检索系统也随之得到了广泛的应用。Google图片搜索等通用Web图片搜索引擎是现在应用最为的广泛的,它的服务对象是所有通用领域的用户。不仅如此,图片检索还被应用于许多专业领域,常见的有:

医药领域。大部分的医学及相关专业由于要进行诊断和疾病检查,故会涉及到可视信息资料,如:X光、扫描影像等。在相关信息的分析、传输以及存储方面,图片检索技术发挥了重要作用,图像处理是目前这个领域的研究重点,如:在肿瘤生长跟踪方面采用了特征检测。应用于这个领域的系统中已有成功的案例。

图形设计领域。重要现有的设计,对于这个领域的从业者而言,可获得许多素材与灵感,而图片检索系统可方便工作的开展,此外,还便于用户找到有特殊要求的作品。

出版领域。图片对于出版社、杂志社等单位十分重要,由于需求量较大,它们大多都有自己的图片库,传统的存储与查找所采取的归类方式较多。这个领域的工作人员在查找和选择图片方面所需时间较长,而图片检索系统则可提高图片查找和挑选的效率。

此外,图片检索还被应用于建筑设计、天文地理以及犯罪取证等领域。

2.2 用户检索方式技术

与网页检索相比,图片检索在检索方式上有较大区别。目前基本上只有关键字查询这种网页检索系统,因为在现有的考虑范围内只有文字可以描述网页内容。而用于描述图片的除了文字之外,还有图片自身。所以,图片的检索方式一般比较多,站在用户检索的角度来看,主要有目录式检索、关键字查询、实例式检索以及属性式检索四类。

⑴目录式检索。yahoo网页搜索的特点也体现在了其图片搜索上,对图片实行了分类,用户根据分类结构对查询范围进行细化。这种检索方式下的很多分类工作需要人工完成,所以,其代价也是很大的。

⑵关键字查询。目前,关键字检索方式适用于大型图片搜索引擎。用户输入与所需图片有关的文字,系统根据文字与图片的匹配度对与查询词相对应的图片进行查找。具有较快的检索速度是该检索方式的最大优势,且基于文本的索引技术已发展到成熟阶段。人工标引和自动提取是匹配信息与文字的两种方法。

人工标引在信息检索方面具有较高的准确度。不足的是人工标引的工作量较大,对于海量系统而言很难实现;另外,该方法具有较强的主观性,几乎无法将完整的信息反映出来,且有时所反映的图片信息有误。

自动提取方法的准确度则没有人工标引方法高。因为信息具有多种组织形式,且具体组织形式的确定存在较大难度,对与图片相匹配的信息很难确定。该方法下的信息提取所采取的是启发式规则,信息获取所采用的是使用较多的模式,同时,信息的准确性可通过无用信息过滤等技术来加强。

⑶实例式检索。现在基于内容的图片搜索引擎基本上都是实例式检索。系统根据所提供的图片或用户所画的基本形状特征对类似的图片进行查找。较为容易找到类似图片是该方式的优势,而需要用户提供图片则是它的不足之处,因为这样对系统不利。基于内容的检索系统所提供的分类信息一般具有较大的粒度,如:风景、人物等。

⑷属性式检索。属性式检索方式常被用于规模较小的摄影等专业的图片数据库,用户的检索依据可以是图片的某些外在特征,如:作者、拍摄日期等。这类数据库的特点就是管理的统一性,信息通常很规范,可通过当前的关系数据库来创建索引与检索,过程比较简单。

3 检索系统评价

在检索系统中,评价系统有两个非常重要的指标,即查准率与查全率。查准率指的是查询结果中有关文档数与文档总数之比;查全率指的是查找到的有关文档数与所有文档集合中有关文档总数之比。若在特定的查询中,D+、R、R+分别代表所有文档集合中有关文档数、查询结果文档集合以及结果文档中有关文档集合,那么,查准率与查全率则有以下定义:

查准率:

查全率:

查准率与查全率在图片检索系统中是很难度量的,由于图片和文本的有关评价带有较强的主观意识,故几乎无法得到比较具体的统计结果。

4 组成系统架构

组成系统架构的组件较多,一个系统的功能流量也因此得到了体现。第一步就是由用户将图像名称与上下文输入到系统,这样有关列表图像就生成了。各部分细节见下图1。

输入界面前端应用程序设计:Eclipse编译器为用户提供了一个友好的界面,以便于用户进行搜索与选择,可通过部分上下文对人格图片进行浏览,此外,还可查看一个或多个视图模式的图片。

耶拿框架:集成本体和用户界面已采用了耶拿框架l。许多上下文已通过本体语言查询建立。以上查询会由耶拿向推理机传递。完成推理后, Jena会将结果被发送回输出接口。

图像库和输出接口:存储库中已保存了全部选定的图片,检索查询结果输出所对应的图像的名称是一样的。用户在主屏幕对所要查找的上下文进行输入,图像最后将在多个Windows操作系统中出现。

5 文本图片系统应用测试和结果

我们对测试中采用本体的效果进行了评估。通过谷歌搜索引擎及测试关键字方法将个性各异的名字输入到搜索框中,出现的结果很多,而大部分结果的关联性并不大。我们在该系统中对同一查询进行了测试,结果显示效果要好于前者。采用精度、措施以及回忆等不同的方法对结果的进行比较,在不同的场景中,以语义为基础的结果地位最高。总的来说,在本文的实验中,与关键字搜索相比,语义文本搜索更加便于操作。

[参考文献]

[1]徐静.图像搜索引擎的进步与应用现状分析[J].电子商务,2011,04:61-62.

[2]吴江.多媒体搜索引擎创新比较研究[J].图书馆学研究,2012,05:75-79+70.

[3]焦蕾,殷锋社.图像搜索引擎检索模式分析与研究[J].电子设计工程,2012,05:132-134.

[4]王晟,赵壁芳.基于内容的图片搜索引擎研究[J].长沙大学学报,2012,02:40-42.

[5]张俊,石志寒,郭新鹏.基于用户的批量图像元搜索引擎设计[J].科学技术与工程,2013,21:6290-6293+6298.

[6]图片搜索引擎巨无霸系列――一搜”5.5亿图片搜索“读图时代”[J].电脑爱好者,2004,20:73.

[7]王迁.搜索引擎提供“快照”服务的著作权侵权问题研究[J].东方法学,2010,03:126-139.

上一篇:电话营销在车险销售中的问题和对策分析 下一篇:纯电动汽车的研究