搜索引擎的使用浅析

时间:2022-05-18 11:01:20

搜索引擎的使用浅析

摘要:本文对搜索引擎的分类以及工作方式进行了简要介绍,并且以百度为例介绍了关键词搜索和布尔检索的搜索方法。

关键词:搜索引擎;分类;关键字;布尔检索

中图分类号:TP393.4 文献标识码:A文章编号:1007-9599 (2011) 05-0000-01

The Use of Search Engines

Zheng Yandong

(Information Center of Tianjin,Tianjin300040,Chian)

Abstract:The classification of search engines and working methods were introduced,and Baidu as an example of keyword search and Boolean search methods to retrieve.

Keywords:Search engine;Classification;Keywords;Boolean search

网上信息浩如烟海,获取有用的信息难于大海捞针。所以需要一种优异的搜索服务,将网上繁杂的内容整理成为可随心使用的信息。如果缺乏强有力的搜索工具,那么想在网络上寻找一个特定网站,其难度将如在一个没有卡片目录、藏书方法完全随机的图书馆内寻找一本书一样。

一、搜索引擎分类

“工欲善其事,必先利其器”,了解一下搜索引擎的分类,有助于用户提高搜索的速度和精确度。搜索引擎按照工作方式来分,可以分为三种,分别是全文搜索引擎、目录索引搜索引擎和元搜索引擎。

(一)全文搜索引擎。全文搜索引擎是名副其实的搜索引擎,国外具代表性的有Google。国内著名的有百度(Baidu)。Google和百度都是从互联网上提取的各个网站的信息(网页、图片、视频、地图和MP3等),并建立数据库,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户,因此他们是真正的搜索引擎。

从搜索结果来源的角度,全文搜索引擎又可细分为两种,一种是拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,并自建网页数据库,搜索结果直接从自身的数据库中调用,如上面提到的Google和百度引擎;另一种则是租用其他引擎的数据库,并按自定的格式排列搜索结果,如Lycos引擎。

(二)目录索引搜索引擎。目录索引虽然有搜索功能,但在严格意义上算不上是真正的搜索引擎,仅仅是按目录分类的网站链接列表而已。用户完全可以不用进行关键词(Keywords)查询,仅靠分类目录也可找到需要的信息。目录索引中最具代表性的莫过于大名鼎鼎的Yahoo雅虎。搜狐、新浪、网易搜索也都属于这一类。

(三)元搜索引擎。元搜索引擎在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。中文元搜索引擎中具代表性的有搜星搜索引擎。

二、百度搜索

百度是国内最大的商业化全文搜索引擎,占国内80%的市场份额。其功能完备,搜索精度,是目前国内技术水平最高的搜索引擎。其主要支持两种搜索方式:关键词搜索和布尔检索。

(一)关键词搜索。众所周知,要在搜索引擎上搜索信息首先必须输入关键词,所以说关键词搜索是搜索引擎的基础。关键词搜索的特点是使用简单,查询速度快,但是查询结果并不精确。

登陆百度站点之后,选择搜索范围,然后键入搜索内容,单击“百度一下”或者回车即可显示搜索结果,如图1所示。

图1

此例是最基本的搜索方法,即查询包含单个关键词的信息。在使用单个关键词进行搜索时,文明可能会发现检索到的信息很多不是我们想要的。这时就应该进一步缩小搜索范围和结果,即使用两个以上的关键词进行搜索。比如上例使用“猫和老鼠高清图片”为关键词(两个关键词之间加一个空格)进行搜索,即只返回猫和老鼠之中的高清图片。

用户要学会从复杂搜索意图中提炼出最具代表性和指示性的关键词对提高搜索效率至关重要,这方面的技巧(或者说经验)是所有其他搜索技巧的基础。

(二)布尔检索。所谓布尔检索,是指通过标准的布尔逻辑关系来表达关键词与关键词之间逻辑关系的一种查询方法,这种查询方法允许用户键入多个关键词,各个关键词之间的关系可以用逻辑关键词来表示。

1.搜索结果要求不包含某些特定信息。仔细查看使用两个关键词进行搜索的结果,会发现有一部分结果还是不符合要求,大部分涉及 “猫和老鼠”的图片,并不是我们所需要的“猫和老鼠高清壁纸”。怎么办呢?删除不相关的内容。我们发现,这部分无用的资讯,总是和“日志”这个词相关的,另外一些常见词如“历史”等。这就需要使用搜索结果中不包含某些特定信息的方法,百度用减号“-”表示逻辑“非”操作(‘-’前必须有空格)。“A CB”表示搜索包含A但不包含B的内容。

2.通配符。很多搜索引擎支持通配符号,如“*”代表一连串字符,“?”代表单个字符等。比如,“"以*治国"”,表示搜索第一个为“以”,末两个为“治国”的四字短语,中间的“*”可以为任何字符。

3.搜索引擎忽略的字符以及强制搜索。百度搜索引擎默认会对一些网络上出现频率极高的词语或者单词,如“com”、“www”,以及一些符号如“*”、“.”等,作忽略处理。例如,搜索关于www起源的一些历史资料,当以“www的历史Internet”作为关键词搜索就会发现搜索引擎把“www”和“的”都省略了。于是上述过程只搜索了“历史”和“Internet”,这显然不符合要求。

如果要对忽略的关键词进行强制搜索,有两种方法:其一,在关键词前面加上明文的“+”,格式如下“+www+的+历史Internet”;其二为,把关键字用英文双引号引起来,格式如下““+www+的+历史Internet“”。

上一篇:海港流量计检定信息系统的设计与使用 下一篇:微带线通用模型的VC实现