1
文献信息 检索教程  第2版
1.3.1.3 3.1.3 搜索引擎的类型
3.1.3 搜索引擎的类型

搜索引擎可以按照内容组织方式、收录内容、工作语种等进行分类。

1.按内容组织方式区分

搜索引擎按其内容组织方式主要可分为三种,分别是全文搜索引擎(Full Text Search Engine)、目录索引类搜索引擎(Search Index/Directory)和元搜索引擎(Meta Search Engine)。

(1)全文搜索引擎

全文搜索引擎是一种自动搜索引擎,它利用Spider(蜘蛛)程序以某种策略自动地在因特网中搜集和提取信息,由索引器建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。全文搜索引擎的索引数据库中存储的信息有网站名、地址和网页的文本信息,提供的是面向网页的全文检索服务。该类搜索引擎的特点是信息量大,能及时更新,检索的信息全面,查全率高,但由于反馈信息量过多,会存在很多无关的信息,用户还需进行甄别、筛选。

具有代表性的全文搜索引擎有:Google、Lycos、百度等。

(2)目录式搜索引擎

目录式搜索引擎是以人工或半自动的方式搜索信息,由专业人员对信息进行甄别、筛选、分类、加工,建立起以分类导航或分类摘要提供浏览查询为目的的搜索引擎。目录式搜索引擎的索引数据库中存储的信息是网站名、网址和内容提要。该类搜索引擎对网上信息的分类清晰而明确,条理性强,检索到信息的相关性和查准率比较高,但是人工分类成本高,费时费力,标引速度慢,数据库规模也较小,容易遗漏某些信息。目录式和全文搜索引擎各有优劣,也在相互渗透。

目录索引中最具代表性的有Yahoo、搜狐、新浪分类目录搜索等。

(3)元搜索引擎

元搜索引擎(Metasearch Engine),是一种调用其他独立搜索引擎的引擎,也称“搜索引擎之母”。在这里,“元”为“总的”“超越”之意,元搜索引擎就是对多个独立搜索引擎的整合、调用、控制和优化利用。元搜索引擎自身没有数据库,它是在接收用户查询请求后,向其他多个搜索引擎进行递交,并将结果进行去重、重新排序后,作为自己的结果返回给用户。元搜索引擎提供的是面向网页的全文检索。其特点是信息量大而全,但用户需要做进一步的筛选。代表性的外文元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎,如360综合搜索(360 comprehensive search)、搜魅网(http://www.someta.cn/),综合了百度、谷歌、搜狗、中搜等搜索结果)、搜乐搜索(http://www.sooule.com/),整合了Google、百度、必应、搜狗、有道、搜搜和中搜等搜索引擎)等。

2.按收录内容区分

搜索引擎按照收录内容可以分为综合型和专题型两大类。

综合型搜索引擎是指搜索各类主题、类型资源的搜索引擎,如Google和百度。

专题型搜索引擎又称垂直搜索引擎,为2006年后逐步兴起的一类搜索引擎。不同于通用的网页搜索引擎,垂直搜索专注于特定的搜索领域和搜索需求(例如,生活搜索、视频搜索、图片搜索、旅游搜索等),在其特定的搜索领域有更好的用户体验。相比通用搜索动辄数千台检索服务器,垂直搜索需要的硬件成本低、用户需求特定、查询的方式多样。

3.按工作语种区分

搜索引擎按照工作语种可以分为单语种搜索引擎和多语种搜索引擎。

单语种搜索引擎是指搜索时只能用一种语言检索的搜索引擎;多语种搜索引擎是指可以用多种语言查询的搜索引擎,如Altavista,可支持25种不同的语言进行搜索。