1
大学生信息素养
1.4.2.3 三、元搜索引擎
三、元搜索引擎

元搜索引擎(METASearch Engine)是指接受用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的是搜星搜索引擎。在搜索结果排列方面,有的直接按来源排列搜索结果,如Dogpile;有的则按自定的规则将结果重新排列组合,如Vivisimo。

元搜索引擎,通过一个统一的用户界面帮助用户在多个搜索引擎中选择和利用合适的(甚至是同时利用若干个)搜索引擎来实现检索操作,是对分布于网络的多种检索工具的全局控制机制。

元搜索引擎的出现,对于那些需要连续地使用不同的搜索引擎重复相同的检索的人来说,是一个福音。

1.Dogpile(http://www.dogpile.com/)

Dogpile是1996年12月由美国人AaronFlin创制的杰出的并行式和串行式相结合的混合式元搜索引擎,是最受欢迎的元搜索引擎。Dogpile暂不支持中文搜索。

Dogpile已可以调用Google、Yahoo、MSN、AskJeeves、LookSmart、About、Overture、Teoma、FindWhat、FindWhat、Ditto、FindWhat、AltaVista、FAST、Infoseek、RealNames、DirectHit、Deja、Lycos、Singingfish、Dmoz、Topix、Fox、WebCatalog等20多个独立的Web Search Engine(万维网搜索引擎)、Usenet Search Engine(新闻组搜索引擎)和FTP Search Engine(FTP搜索引擎)源搜索引擎。而且在垂直型搜索引擎的收录方面,也较全面地覆盖了图像、视音频、新闻、黄页、白页等不同资源类型。与其他元搜索引擎相比,Dogpile可称得上是成员引擎质量高、专门资源类型多的元搜索工具之一。

每次检索时,Dogpile首先调用一组(Google、Yahoo、MSN、Ask Jeeves共4个)成员引擎,并将每个引擎所用的检索式、检索结果及数量分别列出。如果用户对检索结果不满意,可单击“Next”(下一组搜索引擎)按钮,此时Dogpile会选择另外4个成员搜索引擎再次进行并行检索,同时显示出还有多少个成员搜索引擎没有被调用。如果用户对成员引擎4个一组的分组顺序不满意,系统也提供“Custom Search”定制功能,允许用户自行规定使用成员引擎的顺序。

目前,Dogpile在检索功能设置上提供了两种不同的检索方式:基本检索和高级检索。其中,基本检索方式界面简单,用户输入关键词即可进行检索,同时输入多个关键词时,系统自动按照“逻辑与”关系进行组配检索;高级检索方式则按照资源的特点,分别提供Webpages、Images、Audio、Multimedia、News等不同的查询类型,并允许用户进行各种参数的设定。

在高级检索中,用户可以进行检索词逻辑关系(Qualify Your Search)、语言过滤(Language Filter)、日期限定(Date)、域名过滤(Domain Filter)、检索过滤(Search Filter)、拼写更正(Spelling Correction)、检索词在结果中的黑体显示(Bold Search Terms)、检索历史(Recent Searches)、检索结果显示(Results Display)等参数的个性化选择和设置,获得更理想的查询结果。

改进对商业赞助商资源的显示方式。为了减少对用户的误导,Dogpile在继续保留商业性资源在检索结果中显示的基础上,对这些已收费的赞助性资源进行了标注,以便用户进行区分。目前,Dogpile的这种做法在搜索界已逐渐被接受,并成为一种流行的经营形式。

2.Vivisimo(http://www.vivisimo.com)

Vivisimo创建于2000年,是一个出现较晚的并行元搜索引擎,以提供对检索结果的自动聚类功能而著名。

3.Ixquick(http://www.us.ixquick.com)

Ixquick的成员引擎广泛汇集了世界上众多知名的搜索引擎,具体包括:AllTheWeb、AltaVista、EntifeWeb、EuroSeek、Gigablast、Go、Google、MSNSearch、Netscape、OpenDirectory、Overture、Wikipedia、WiseNut、Yahoo等,此外还收录了很多区域性的搜索引擎,例如中国的中搜、搜狐、新浪、百度等。

Ixquick在其主页上自称为“功能最强大的元搜索引擎”。它的搜索服务功能和主要特色可以概括如下:

搜索结果简练、准确。Ixquick仅对每个成员引擎返回的前10条结果进行汇总,经去重分析后呈现给用户。这不仅保证了返回结果的质量,也减轻了用户从大量返回结果中再查找的负担。此外,Ixquick还根据同一网页在不同成员引擎返回结果的共现情况,对每一条结果进行星级评价。例如,如果一个网页在5个搜索引擎的前10条返回结果中都出现,那么这个网页就被评为五星级。这一独特方法可以很好地综合各成员引擎的排序结果,却不需要对各成员引擎的排序算法有所了解。

检系功能丰富。Ixquick的高级检索方式支持布尔逻辑组配、短语检索、通配符和字段检索等,可为用户提供统一的高级搜索接口。在检索结果优化方面,交互性较强,允许用户对检索结果进行修改,包括删除一条结果和查看一条结果的相关结果。

全球化搜索。Ixquick支持18种语言,包括中文、日文、韩文等。当用户选择一种检索语种后,Ixquick会根据语种自动选择、调用一些区域性的搜索引擎,同时将所有的国际性搜索引擎一并作为搜索来源。

4.其他元搜索引擎

(1)觅搜(http://www.metasoo.com/)

搜索结果主要来自Google、百度、Yahoo、Bing、搜狗、有道等搜索引擎系统,部分搜索结果经过觅搜进行重新排序。

(2)万纬搜索(http://www.widewaysearch.com)

目前,它共集成了包括中英文引擎在内的10多个独立引擎。用户可以根据需要自由选择其中的若干个进行同步检索,检索结果可以按照相关度值、时间、域名分类或来源引擎等排序输出。

(3)搜乐(http://www.sooule.com/)

目前,搜乐在同一页面无缝整合Google、百度、必应、搜狗、有道、搜搜和中搜等搜索引擎,让互联网用户在近千亿网页及文档中瞬间完成搜索,搜乐自动消除重复的结果项,节省用户用于筛选搜索结果的时间,为用户提供更好的搜索体验。

(4)XISOSO元搜索(http://www.xisoso.com/)

可选择以下搜索组合Google+Baidu、Google+Yahoo、Google+Yahoo(只搜英文)。

(5)Metacrawler(http://www.metacrawler.com)

能够同时调用数十个独立引擎进行信息查询,并对检索结果进行统一的整理,然后按相关度的大小排序输出。

(6)Profusion(http://www.profusion.com)

Profusion经过不断的改造和优化,目前开发出了一系列更加有利于用户的信息检索服务功能,例如:基于E-mail的Alert个性化服务功能,可使用户跟踪网页及检索词变化,并对相应的变化及检索结果进行分析;与Intelliseek公司合作,利用它的InvisibleWeb搜索工具对百科全书、数据库等信息进行搜索和查询,为用户提供网页搜索以外更有价值的信息;对检索结果进行聚类、统计分析等。