1
文献信息 检索教程  第2版
1.3.2.1 3.2.1 百度
3.2.1 百度

百度(http://www.baidu.com/)由资深的信息检索技术专家李彦宏与好友徐勇共同创建。公司于2000年1月在北京中关村创立。2001年,李彦宏在百度董事会上提出百度转型做独立搜索引擎网站,开展竞价排名的计划。2005年,百度在美国纳斯达克成功上市,并成为首家进入纳斯达克成分股的中国公司。随后实施“闪电计划”对百度实行第二次技术升级后,百度已成为全球第二大的独立搜索引擎,在中文搜索引擎中名列第一。2016年百度成功在欧洲新推出了一项地图服务,为在欧旅行的中国人提供服务,并开始积极拓展国际搜索引擎市场。9月,百度世界大会以“人工智能”为主题,人工智能将是百度核心中的核心,对百度意味着百度大脑。百度将会围绕算法(神经网络、参数和样本训练)、计算能力(服务器和GPU集群),以及大数据(网页资料、搜索数据、图像视频数据和定位数据)等三个方面,从自然语言的处理、语音识别、图像识别处理以及用户画像等四个能力展开应用。

百度搜索简单方便,是集新闻、网页、贴吧、知道、音乐、图片、视频、地图、百科、文库等搜索为一身的综合性搜索引擎(如图3-3所示)。

图3-3 百度主页

1.百度搜索技巧

(1)布尔逻辑检索

百度搜索中,不支持布尔逻辑检索“AND”“+”符号的使用,逻辑“与”用空格表示,语法是“A B”;逻辑“非”用“-”来表示,语法是“A-B”;逻辑“或”用“|”来表示,语法是“A|B”。

(2)字段限定检索

百度搜索中,可以限定在标题中、网站内、URL中查找所要的信息。

把搜索范围限定在网页标题中——intitle:标题。可以限定只搜索网页标题中含有检索词的网页。例如,“intitle:中国大学”表示标题中含有检索词“中国”和“大学”的网页。

把搜索范围限定在特定站点中——site:站名。可以限定只搜索某个具体网站或某域名内的网页。例如:“纳米材料site:emuch.net”表示在emuch.net(小木虫学术论坛)网站内搜索和“纳米材料”相关的资料。

把搜索范围限定在url(统一资源定位器)链接中——inurl:链接。可以限定只搜索URL中含有这些文字的网页。例如:“青花瓷inurl:mp3”表示“mp3”必须出现在网页URL中,“青花瓷”可以出现在网页的任何位置。

(3)双引号“”和书名号《》精确匹配

使用双引号把检索词括起来,可以精确匹配检索词进行搜索。例如,搜索郑州轻工业学院,如果不加双引号,检索词可能被拆分,但加上双引号后,“郑州轻工业学院”就不会被拆分了。

查询词加上书名号《》有两层特殊功能,一是书名号会出现在搜索结果中;二是被书名号扩起来的内容,不会被拆分。书名号在某些情况下特别有效果,比如查询词为手机,如果不加书名号,在很多情况下出来的是通讯工具手机,而加上书名号后,《手机》结果就都是关于电影方面的了。

(4)专业文档搜索

因特网上的许多资料,不是以普通网页的形式出现,而是以Word、PDF、TXT等格式存在的文档。百度支持对这些文档(如Word、Excel、Powerpoint、PDF、TXT、RTF等)进行全文搜索,只需在检索词后加一个“filetype:”进行文档类型的限定,ALL则可以表示搜索所有文档类型。例如要搜索“化学”的Powerpoint文档,只需在搜索框中输入“化学filetype:ppt”即可;查找个人文献管理软件endnote的使用教程,可在检索框中输入“endnote(教程|使用|技巧|指南|攻略|手册)filetype:PDF”,可查找到关于endnote软件学习的PDF文件。

2.百度的特色功能

百度提供百度百科、百度知道、文库、百度学术、百度外卖、百度财富、百度云、百度快照、图片、视频、音乐等特色服务,下面简单介绍几种。

(1)百度百科

百度百科(http://baike.baidu.com/)(如图3-4所示)是百度2006年4月推出的一部内容开放、自由的网络百科全书,提倡网络面前人人平等,所有人共同协作编写百科全书,让知识在一定的技术规则和文化脉络下得以不断组合和拓展。为用户提供一个创造性的网络平台,强调用户的参与和奉献精神,充分调动因特网所有用户的力量,汇聚上亿用户的头脑智慧,积极进行交流和分享,同时实现与搜索引擎的完美结合,从不同的层次上满足用户对信息的需求。百度百科的目标是成为全球最大的中文网络百科全书,2016年9月,百度百科已拥有一千三百多万个词条。

图3-4 百度百科

(2)百度文库

百度文库(http://wenku.baidu.com/)(如图3-5所示)是因特网分享学习的开放平台,供网友在线分享文档的开放平台。2010年7月8日,百度文库手机版上线。2010年11月10日,百度文库文档数量突破1 000万。2011年12月文库优化改版,内容专注于教育、PPT、专业文献、应用文书四大领域。2013年11月正式推出文库个人认证项目。截至2014年4月文库文档数量已突破一亿。涵盖基础教育、资格考试、经营管理、工程技术、IT计算机、医药卫生等50余行业。

用户首先需要注册一个百度账号,就可以在线阅读和下载涉及课件、习题、考试题库、论文报告、专业资料、各类公文模板、法律文件、文学小说等多个领域的资料,平台所累积的文档,均来自热心用户上传,百度自身不编辑或修改用户上传的文档内容。用户通过上传文档获得平台虚拟的积分奖励,但下载上传用户已标价的文档,需付出虚拟积分,免费文档登录后即可下载。百度文库已实现对手机终端的支持,对DOC、PPT、PDF、TXT、XLS格式等多种文档格式的兼容和批量上传功能的完善。

图3-5 百度“文库”界面

(3)百度知道

百度知道(http://zhidao.baidu.com/)(如图3-6所示)是一个基于搜索的互动式知识问答分享平台,于2005年6月21日发布,并于2005年11月8日转为正式版。百度知道一直探索国际化发展,于2012年3月31日发布百度知道台湾版。“百度知道”是用户自己根据具体需求有针对性地提出问题,通过积分奖励机制发动百度知道界面其他用户,来解决该问题的搜索模式。同时,这些问题的答案又会进一步作为搜索结果,提供给其他有类似疑问的用户,达到分享知识的效果。百度知道也可以看作是对搜索引擎功能的一种补充,通过对回答的沉淀和组织形成新的信息库,其中信息可被用户进一步检索和利用。这意味着,用户既是搜索引擎的使用者,同时也是创造者。

图3-6 百度“知道”界面

(4)百度学术

百度学术搜索(如图3-7和图3-8所示)是一个提供海量中英文文献检索的学术资源搜索平台,涵盖了中国知网、万方数据、维普、Spring link等中外文学术期刊、会议论文,旨在为国内外学者提供最好科研体验。

图3-7 百度学术界面

图3-8 百度学术检索界面

百度学术默认的排序方式为相关度,还可以通过调整排序方式来更进一步搜索,文章题目后面有的会有红色的下载符号,这样的文献表明此文章可以通过百度学术下载,正下方显示文献来源,多个版本时,版本部分是可以单击的,这样方便看到此文章被哪些数据库收录。