应用是根 第13期

时间:2022-06-29 01:24:38

应用是根 第13期

搜索引擎很多,对搜索引擎的评测也很多。不过评价一个搜索引擎是否适合自己,还需从自己的实际需要出发。另外,用好搜索引擎还有许多窍门。

搜索引擎已经是广大网民非常熟悉的一个概念了。据调查,至少有超过80%的网民使用搜索引擎服务,进行诸如查找信息、寻求帮助、学习知识甚至寻找失去联系的亲朋好友等工作。目前搜索引擎是广大网民经常使用的第二大网络服务,仅次于电子邮件,它几乎已经成了我们生活中不可或缺的一部分。

作为使用Internet必不可少的工具,搜索引擎的地位越来越重要。同时,搜索引擎作为一个新兴的产业也在蓬勃发展。Google和百度的股价高涨也说明了这一点。成立不到10年的Google的市值甚至超过了老牌的大公司IBM和可口可乐。

如何评价一个搜索引擎

搜索引擎产品竞争激烈,使得评判这些产品检索能力的优劣成为搜索引擎用户或者利用搜索引擎进行产品推广的企业的必然选择。当前搜索引擎的评价方式众多,进行评测服务的企业和组织也有不少。当前在搜索引擎的评价上存在着各种各样的或主观或客观的标准和指标。不过由于立场和侧重点不同,这些评价方式既有各自的特点,也都难免有一些缺陷。广大搜索引擎用户在参考这些评价报告时,也要注意从自己的实际需要出发,才能真正做到心中有数。

首先,我们必须弄清楚为什么样的目的去进行搜索引擎的评价。比如普通用户对于搜索引擎的期望和评价标准,与搜索引擎的研究机构以及投资企业就有着很大的不同。

对普通用户来说,最重要的显然是找到自己需要的信息。因而他们更关心哪个具体的搜索引擎更加好用,能够帮助自己更快、更好地找到需要的目标信息;或者在查找不同类型的资料时,如何选择合适的搜索工具。

从用户的角度看,对搜索引擎的评价可以分成几个方面:搜索结果准确度,信息覆盖全面性,搜索速度,信息更新速度,以及使用的方便性等。

有调查结果显示,网民最关心搜索结果有效性。在选用搜索引擎最主要的依据上,超过一半的网民认为搜索结果准确度最重要。用户使用搜索引擎的直接目的是找到其所需要的信息,搜索引擎只要做到“查全”与“查准”,就能让用户基本满意。如果再将结果优化,使其对用户来说更加有效,那么用户对这个搜索引擎就会有很高的忠诚度。对用户来说,技术无所谓高低,达到目标就行,技术从低到高不断改进、不断满足需求就会使用户满意。

搜索速度也是用户关心的一个重要特性。影响搜索引擎速度的因素主要有两个。一个是搜索引擎系统本身的信息查找速度,另一个是用户与搜索引擎之间的网络的速度。现在的著名搜索引擎在运行速度上一般基本都能令人满意,通常查找时间都在1秒以内,因而目前真正影响用户使用的主要是网络速度。由于搜索引擎和用户所处的网络位置不同,通常需要用户实际试验来确定对自己网络速度最快的引擎。

网上的信息变化非常快。每天都会出现成千上万的新网页,同时也会有无数的网页失效。能不能及时地反映网上的信息变化,也是衡量搜索引擎的重要指标。一方面要看我们关心的新闻动态是否能够及时反映在搜索内容中。现在多数的搜索引擎,对于更新较快的新闻网站的索引时间都能够达到一天以内,好一些的甚至能能够做到一两个小时就能更新。另一方面,对于已经失效的页面也要及时剔除。如果搜索结果中存在大量“死链接”,就会让用户觉得效果很差了。

使用方便性也很重要。一个搜索引擎即使功能再强大,内容再丰富,如果操作烦琐,界面晦涩难懂,也很难得到用户的认可。

搜索引擎的研究机构进行评价的目的是为了促进信息检索的理论和技术研究,并进一步发展出更好的搜索技术。因而通常需要建立一个科学、公正、自动的全面的搜索引擎评价体系,通过各种数字化的指标来对搜索引擎的性能进行衡量,我们简单地概括一下常用的评价指标。

搜索引擎评价的三类方法

为了从互联网海量的信息资源中方便、准确地找到所需要的信息,20世纪90 年代中期人们发明了检索信息资源的搜索引擎技术。此后,各种各样的搜索引擎蜂拥而出,让人既兴奋又无所适从,不知该如何评价和选择它们。于是,与搜索引擎的出现几乎同时,人们也开始探索各种比较和评价它们性能的方法。而根据比较评价方式的不同,一般可以将这些工作划分成以下三类:

1.以描述为主的搜索引擎评价方式,包括用文字对搜索引擎特性的非量化的描述,以及大多数商业评价报告的评价。比如“最大的搜索引擎”,“最智能的搜索引擎”,“第三代搜索引擎”等等。这种评价方式多停留在对单个搜索引擎各个因素的描述,不能整体地评价多个搜索引擎的性能优劣。

2.对系统外部特性的评价:将搜索引擎视为单独的系统,综合考虑其响应时间、死链接率、索引更新间隔等系统特性。由于没有考虑用户的实际需要,忽略了实际用户使用搜索引擎的方式,缺少可信度与灵活度。

3.基于用户实际需要的评价:收集实际使用中最具概括性与全面性的Query,通过评价函数获得相应评价指标的数值,以区分不同搜索引擎在该评价指标对应物理意义上的差别。TREC与Trels的评价指标对应的评价方式都是该类评价,都具有较高的可信度,尤其Trels更加灵活方便。

投资者或广告投放企业关心的则是诸如搜索引擎的市场占有率、投放广告的回报率等。

如何用好搜索引擎

经过多年的发展和进步,目前的搜索引擎都已经相当好用了。无论从用户界面的友好性,还是返回结果的准确性方面来看,都能够让一般的用户感到满意。搜索引擎的使用难度也很低,普通人并不需要特殊的培训就能够轻松地查找信息。想当初笔者上大学的时候,还专门要上一门《科技文献检索》的课程,真是今非昔比呀。不过,由于目前搜索引擎的智能化程度还很低,有时并不能够返回用户真正需要的结果。有很多时候还需要用户更多的开动脑筋,想想办法,多次尝试,甚至使用一些技巧,才能得到自己真正想要的结果。

要想更好地使用搜索引擎,首先要勇于尝试。目前搜索引擎都是免费使用的,而且是非常欢迎大家使用的。我们在查找需要的信息的时候,大可以多试几次,以期得到最满意的结果。其次要注意总结经验。在搜索过程中多思考、多总结,记录成功的经验,对以后的搜索会有很大的帮助。

下面关于普通用户如何更好地使用搜索引擎提一些小小的建议。

选择适当的关键词。毋庸置疑,选择正确的关键词是一切的开始。学会从复杂搜索意图中提练出最具代表性和指示性的关键词对提高信息查询效率至关重要,这方面的技巧是所有搜索技巧的基础。同时,搜索条件越具体,搜索引擎返回的结果就越精确,有时多输入一两个关键词效果就完全不同,这是搜索的基本技巧之一。我们还可以在搜索过程中,根据返回的结果适当调整关键词。

使用逻辑命令。搜索中的逻辑命令一般是指 “AND”、“OR”、“NOT”,以及与之对应的“+”、“-”等逻辑符号命令。Google可以在查询词中使用“-”来指定返回结果能不包含某个特定的词。也可以使用“高级搜索”来实现相应的功能。

进行精确匹配。精确匹配搜索是缩小搜索结果范围的有力工具。一般来说,搜索引擎会把查询输入分成单个的词,然后查找包含这些词的页面。但是这样并不能够保证输入中连续的查询词在返回的页面中也是连续的。但是如果我们用引号(“”)把相邻的一些词连起来,就能够保证查到页面中包含这些相邻的词。

使用特殊搜索命令。除普通搜索之外,很多搜索引擎都提供一些特殊搜索命令,来满足一些高级用户的特殊需求。比如Google可以使用site:命令指定在某个特定的网站内查找相关信息;使用inurl:命令和intitle:命令指定仅在网页的url或title中搜索(有关更多的Google搜索命令,可以查看Google网站的帮助,或在网上查找“Google使用从入门道精通”)。其他搜索引擎也有类似的命令。这些命令虽然不是很常用,但当有这方面搜索需求时,它们就能够起到很大的作用。

上一篇:好马配好鞍 下一篇:尴尬Napa