1
文献信息 检索教程  第2版
1.3.3.2 3.3.2 Yahoo!
3.3.2 Yahoo!

Yahoo!(http://www.yahoo.com/)是世界上最早的搜索引擎之一,由斯坦福大学的两位博士研究生David Filo和Jerry Yang(杨致远)于1994年创建。Yahoo一词源于《格列佛游记》一个在外表和行为举止上都非常讨厌的家伙——列胡,而创始人喜欢字典里对Yahoo的定义“粗鲁,不通世故,粗俗”。雅虎是全球第一家提供因特网导航服务的网站,是世界上最早的分类目录搜索引擎,在浏览量、网上广告、家庭或商业用户接触面上,都居于领导地位,也是最为人熟悉、最有价值的因特网品牌之一(如图3-29和图3-30所示)。服务包括搜索引擎、电邮、新闻等,业务遍及24个国家和地区,为全球超过5亿的独立用户提供多元化的网络服务。同时也是一家全球性的因特网通信、商贸及媒体公司。雅虎是最老的“分类目录”搜索数据库,也是最重要的搜索服务网站之一。1999年9月,雅虎中国网站开通,2007年5月雅虎中国更名为中国雅虎。Yahoo!中文版并非英文版的全文翻译,而是针对大陆、香港和台湾的访问者的需要、兴趣与习惯将信息集中起来供中文读者使用。它收录了全球因特网上众多的中文站点,为全球中文读者提供中文Internet导航服务。

图3-29 Yahoo! 主页

图3-30 Yahoo!检索页面

雅虎有英文、中文、日文、韩文、法文、德文、意大利文、西班牙文、丹麦文等12种语言版本,各版本的内容互不相同。提供目录、网站及全文检索功能。目录分类比较合理,层次深,类目设置好,网站提要严格清楚,网站收录丰富,检索结果精确度较高。2015年雅虎已成为“全球第三大移动广告公司”。

2016年,美国电信巨头Verizon(威瑞森)以48亿美元收购雅虎核心资产。

Yahoo!提供分类目录检索、关键词检索两种检索方式。

1.分类目录检索

Yahoo!主页的顶端有搜索框,可以直接选择进行Web(网页)、Images(图片)、Video(视频)等的查询,单击“More”可进入Yahoo!检索页面(如图3-36所示),这里提供了共17种搜索服务。用户可以根据自己的查询需要,选择不同的种类和类型。单击“Directory Search”可以进入Yahoo!的分类目录进行查询或浏览(如图3-31和图3-32所示)。

3-31 Yahoo!“Directory search”

图3-32 Yahoo!“Directory”页面

Yahoo!的分类目录按内容分为14个大类:Arts&Humanities(艺术与人文)、Business&Economy(商业和经济)、Computer&Internet(计算机和因特网)、Education(教育)、Entertainment(娱乐)、Government(政府)、Healthy(健康)、News&Media(新闻与媒体)、Recreation&Sports(休闲与体育)、Reference(参考文献)、Regional(地区)、Science(科学)、Social Science(社会科学)、Society&Culture(社会与文化)。用户可以选择分类浏览或检索有关信息,每个大类又分为若干小类,可以进一步链接到更加细化的下一级目录,最后得到一个与特定主题相关的网页列表。通过分类目录的方式检索,用户往往需要经过多层的深入查询才能得到一个网页列表,但网页集合的相关性通常比较高,即查准率高。

2.关键词检索

直接在检索框内输入关键词,然后单击右侧的“Search”按钮或按回车键(Enter),即可得到相关的记录。

Yahoo!搜索引擎支持一些特定的操作符,用于对查找的内容进行限定,用法如下。

(1)双引号(“”):将引号中的检索项作为一个固定词组来进行精确匹配。

(2)星号(*):截词符,用于词干后,搜索出同一词干的所有结果。

(3)加号(+):加词检索,用于检索词前,表示该检索词必须出现在检索结果中。

(4)减号(-):减词检索,用于检索词前,表示该检索词不能出现在检索结果中。

(5)限定(t:和u:):在检索词前输入t:,表示限定在网页标题中搜索;在检索词前输入u:,表示限定在网址中搜索。

除此以外,Yahoo!各搜索服务页面上,还提供高级检索页面。图3-33所示为Yahoo!“Advanced Web Search”页面。在该页面中,用户可以利用各检索框对搜索方式和范围加以限制。

(1)所有词匹配(all of these words):可以输入一个或多个关键词,以空格分隔,检索结果必须包含输入的所有单词,相当于逻辑“与”关系。

(2)精确短语匹配(the exact phrase):将输入的检索词作为一个完整、固定的短语精确匹配,搜索结果中必须包含这一准确的短语。

(3)任何词匹配(any of these words):如果输入的检索词由几个单词组成,则检索结果包含其中某个或几个单词,相当于逻辑“或”关系。

(4)排除匹配(none of these words):检索结果中不包含所输入的所有词,相当于逻辑“非”关系。

高级检索可限定仅在含有.com、.edu、.gov、.org的站点或域中进行检索,缩小检索范围,提高查准率。

图3-33 “Advanced Web Search”页面