1
文献信息 检索教程  第2版
1.3.1.4 3.1.4 搜索引擎的基本检索技术
3.1.4 搜索引擎的基本检索技术

搜索引擎的检索方法主要包括简单搜索、高级搜索和分类搜索三种。

1.简单搜索(simp le search)

简单搜索是最基本、最快捷的检索方法,进入搜索引擎网页后,在输入框中直接输入单词或者词组检索词,然后单击“查询”即可。该检索默认为模糊匹配,用户需要进行精确匹配和查找,如想提高查准率,获得精确匹配,可将检索词放在“”内。

2.高级搜索(Advanced Search)

高级搜索又称定制搜索,是指用布尔逻辑组配方式进行的检索。布尔逻辑组配方式包括逻辑“与”、逻辑“或”和逻辑“非”三种。

(1)逻辑“与”:一般用“AND”“&”“+”来表示,中文搜索引擎都可以用空格表示,用来检索两个及两个以上的检索词,检索结果应包含全部检索词。格式为“检索词A(空格)检索词B”,查询网页既要包含A,又要包含B,两者缺一不可。

(2)逻辑“或”:一般用“OR”“|”来表示,用于检索包含两个以上关键词中的含有某一个关键词的结果,可提高查全率。格式为“检索词A|检索词B”,查询网页包含A,或者包含B。

(3)逻辑“非”:一般用“NOT”“-”表示,有的搜索引擎用“!”表示。用于搜索包含NOT前的关键词,但排除NOT后的关键词的网页。格式为“检索词A-检索词B”,减号前要有空格,用来查询网页包含A,但不包含B的网页。

有些搜索引擎的高级检索“完全支持”布尔逻辑检索,如Excite,Infoseek,有些“部分支持”,如Yahoo只支持“AND”“OR”;还有些搜索引擎只在简单检索中“部分支持”,如HotBot、Lycos等。在中文搜索引擎中,通常是通过特殊操作符,如“+”“|”“-”“!”等(需要用半角输入代表逻辑关系的字符)。

3.目录搜索(Catalog Search)

目录搜索也称分类搜索,是指用户按照搜索引擎提供的分类目录,选择类别逐级进行查询,一般不需要输入检索词。这种搜索方式主要体现在目录式搜索引擎中。

4.其他常用搜索规则

以上介绍的简单、高级搜索和目录搜索方法是在搜索引擎的检索中最常用到的,除此之外,还可以配合其他检索技术进行使用,下面介绍几种大多数搜索引擎都支持的检索技术。

(1)截词符检索

截词符一般用星号(*)表示。当“*”置于一个词的末尾时,表示将相同词干的词全部检索出来。例如:检索式“compu*”,则表示可以检索到compute、computer、computing等词。有一些搜索引擎支持自动截词,用户不需要专门输入截词符,系统自动将相同词干的词全部找出来。注意:“*”不能用在检索词的开始和中间。

(2)邻近符检索

邻近符(NEAR)用于检索在一定区域范围内同时出现检索单词的文档。用NEAR/n(n为1,2,3…)可精确控制检索词之间的距离,表示检索词之间的间距最大不超过n个单词。例如:检索式“Computer near/10 Technology”,可以查找出“Computer”和“Technology”两词之间插入不大于10个单词的页面,检索结果输出时,间隔越小的排列位置越靠前。

(3)字段限定检索

字段限定检索是指限定检索词在搜索引擎数据库中某个字段范围内进行查找,可以是网页标题、网址、站点或链接等。

①标题检索:加“t:”或“title:”在关键词前,搜索引擎进行的是标题检索,即只检索出标题中包括关键词的网页。

②URL检索:加“u:”或“url:”在关键词前,搜索引擎进行的是网址检索,可检索出网页地址URL中含有关键词的页面。

③站点检索:就是在网站地址域名中检索输入的词,以查找用户指定站点上的所有页面,使用的命令是“host:”。

④链接检索:就是在与特定网页或域有链接的所有网页中进行检索,使用的命令是“link:”。

(4)使用标点符号检索

在搜索引擎中,标点符号也可以被用于进行页面或文档的查找,常用的有空格、逗号、括号、引号等。

①空格。空格的作用与逻辑“与”(AND)相同。例如:检索式“A B”,表示可查出含有“A”和“B”的页面。

②逗号。逗号的作用类似于逻辑“或”(OR),查找至少包括一个关键词的文档,所不同的是,检索结果输出时,包含指定关键词越多的页面,其排列的位置越靠前,即越优先输出。例如:检索式“因特网,计算机,技术”,可查出包含三个关键词的人和一个或几个的页面,但同时含有“因特网”“计算机”和“技术”的页面输出时排在前面。

③括号。括号的作用是使括在其中的运算符优先执行,用于改变复杂检索式中固有逻辑运算符优先级的次序。例如,检索式“因特网AND(计算机OR电脑)”,表示要求先执行括号中的“OR”运算,再执行括号外的“AND”运算。

④引号。引号的作用是用来组合关键词,让搜索引擎将关键词组或短语作为一个字符串在其数据库中进行搜索,找到含有与短语词序和意义完全相同的页面。例如,检索式“Computer Technology”,表示把Computer Technology当作一个短语进行精确匹配来搜索。如果不加引号,搜索引擎会查出包含Computer和Technology的页面,可能会与用户要求的主题内容相差较远。所以用引号可以提高搜索的精准度,绝大部分的搜索引擎都支持这种用引号精确匹配的短语搜索。