1. 全文搜索引擎
全文搜索引擎就是从互联网上提取各个网站的信息(以网页文字为住)而建立的数据库中,检索与用户查询条件相匹配的相关记录,然后按一定排列顺序将结果返回给用户。他们是真正意义上的搜索引擎。
搜索引擎的自动信息搜集功能分两种。一种是定期搜索,即每隔异端时间,搜索引擎主动派出“蜘蛛程序”,对一定IP地址范围内的互联网站进行检索,一旦发现新的网站,它会自动提取网站的信息和网址加入自己的数据库。
另一种是提交网站搜索,即网站拥有者主动向搜索引擎提交网址,搜索引擎在一定时间内定向向提交网站派出“蜘蛛”程序,扫描网站并将有关信息存入数据库,以备用户查询。由于近年来搜索引擎索引规则发生了很大变化,主动提交网址并不保证你的网站能进入搜索引擎数据库,因此目前最好的办法是多获得一些外部连接,让搜索引擎有更多机会找到你并自动将你的网站收录。
当用户以关键词查找信息时,搜索引擎会在数据库中进行搜寻,如果找到与用户要求内容相符的网站,便采用特殊的算法——通常根据网页中关键词的匹配程度,出现的位置/频次,连接质量等——计算出各网页的相关度及排名等级,然后根据关联度高低,按顺序将这些网页连接返回给用户。
2.目录索引类搜索引擎
目录索引类搜索引擎就是按照目录分类的网站连接列表,用户完全可以不用关键字进行查询,仅靠分类目录找到需要的信息。
与全文搜索引擎相比,目录索引类搜索引擎有许多不同之处。
首先,全文搜索引擎属于自动网站检索,而目录索引则完全依赖手工操作,用户提交网站后,目录编辑人员会亲自浏览你的网站,然后根据一套自定的评判标准甚至编辑人员的主观印象,决定是否接纳企业的网站。
其次,全文搜索引擎收录网站时,只要网站本身没有违反有关的规则 , 一般都能登录成功。而目录索引对网站的要求则高得多 , 有时即使登录多次也不一定成功。尤其像 Yahoo 这样的超级索引 , 登录更是困难。
此外 , 在登录全文搜索引擎时 , 我们一般不用考虑网站的分类问题 , 而登录目录索引时则必须将网站放在一个最合适的目录(dkectory) 。
最后 , 全文搜索引擎中各网站的有关信息都是从用户网页中自动提取的 , 所以从用户的角度看 , 搜索引擎拥有更多的自主权 : 而目录索引则要求必须手工另外填写网站信息,而且还有各种各样的限制,更有甚者,如果工作人员认为你提交的网站的目录、信息不合适 , 他可以随时对其进行调整 , 当然事先是不会和你商量的。
目录索引 , 顾名思义就是将网站分门别类地存放在相应的目录中 , 因此用 户在查询信息时 , 可选择关键词搜索 , 也可按分类目录逐层查找。如以关键词 搜索 , 返回的结果跟全文搜索引擎一样 , 也是根据信息关联程度排列网站 , 只不过其中人为因素要多一些。如果按分层目录查找 , 某一目录中网站的排名一 般是由标题字母的先后顺序决定。
目前 , 全文搜索引擎与目录索引有相互融合渗透的趋势。原来一些纯粹的 全文搜索引擎现在也提供目录搜索 , 如Google就借用open directory 目录提供分类查询。而象 Yahoo这些老牌目录索引则通过与Google 等搜索引擎合作扩大搜索范围。在默认搜索模式下 , 一些目录类搜索引擎首先返回的是自己目录中匹配的网站 , 如国内搜狐、新浪、网易等 : 而另外一些则默认的是网页搜索 ,如 Yahoo,Yahoo 已于 2004 年 2 月正式推出自己的全文搜索引擎。
3. 元搜索引擎 (META
search engine)
元搜索引擎是在接受用户查询请求时,同时在其他多个引擎上进行搜索 ,并将结果返回给用户。著名的元搜索引擎有 InfoSpace 、 Dogpile 、 Vivisimo 等 , 中文元搜索引擎中具代表性的有搜星搜索引擎。在搜索结果排列方面,有的直接按来源引擎排列搜索结果,如 Dogpile, 有的则按自定的规则将结果重新排列组合 , 如 Vivisimo。
除上述三大类引擎外 , 还有以下几种非主流形式 :
(1)集合式搜索引擎:如 HotBot在2002年底推出的引擎。该引擎类似META搜索引擎,但区别在于不是同时调用多个引擎进行搜索,而是由用户从提供的4个引擎当中选择 , 因此叫它“集合式”搜索引擎更确切些。
(2) 门户搜索引擎 : 如 AOL Search 、 MSN Search 等虽然提供搜索服务,但自身既没有分类目录也没有网页数据库,其搜索结果完全来自其他引擎。
(3) 免费链接列表 (FFA):这类网站一般只简单地滚动排列连接条目,少部分有简单的分类目录,不过规模比起YAHOO等目录索引来要小的多。
由于上述各种类型的网站都能为用户提供搜索查询服务,为方便起见,我们通常将其统称为搜索引擎。
任务点
什么是元搜索引擎?
答:元搜索引擎是在接受用户查询请求时,同时在其他多个引擎上进行搜索 ,并将结果返回给用户。

