1
大学生信息素养
1.4.2.2 二、目录索引编辑
二、目录索引编辑

目录索引也称为分类检索,是因特网上最早提供WWW资源查询的服务,主要通过搜集和整理因特网的资源,根据搜索到网页的内容,将其网址分配到相关分类主题目录的不同层次的类目之下,形成像图书馆目录一样的分类树形结构索引。目录索引无需输入任何文字,只要根据网站提供的主题分类目录,层层点击进入,便可查到所需的网络信息资源。虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已。用户完全可以按照分类目录找到所需要的信息,不依靠关键词(Keywords)进行查询。与全文搜索引擎相比,目录索引有许多不同之处。

首先,搜索引擎属于自动网站检索,而目录索引则完全依赖手工操作。用户提交网站后,目录编辑人员会亲自浏览你的网站,然后根据一套自定的评判标准甚至编辑人员的主观印象,决定是否接纳你的网站。

其次,搜索引擎收录网站时,只要网站本身没有违反有关的规则,一般都能登录成功;而目录索引对网站的要求则高得多,有时即使登录多次也不一定成功。尤其像Yahoo这样的超级索引,登录更是困难。

此外,在登录搜索引擎时,我们一般不用考虑网站的分类问题,而登录目录索引时则必须将网站放在一个最合适的目录(Directory)。

最后,搜索引擎中各网站的有关信息都是从用户网页中自动提取的,所以从用户的角度看,我们拥有更多的自主权;而目录索引则要求必须手工另外填写网站信息,而且还有各种各样的限制。更有甚者,如果工作人员认为你提交网站的目录、网站信息不合适,他可以随时对其进行调整,当然事先是不会和你商量的。搜索引擎与目录索引有相互融合渗透的趋势。一些纯粹的全文搜索引擎也提供目录搜索,如Google就借用Open Directory目录提供分类查询。而像Yahoo 这些老牌目录索引则通过与Google等搜索引擎合作扩大搜索范围。在默认搜索模式下,一些目录类搜索引擎首先返回的是自己目录中匹配的网站,如中国的搜狐、新浪、网易等;而另外一些则默认的是网页搜索,如Yahoo这种引擎的特点是找的准确率比较高。

Yahoo最早于1994年4月由美国斯坦福大学的两名博士生费罗(David Filo)和杨致远(Jerry Yang)建立,当时的名称是“Jerry和David的网络指南信息库”。1995年成立Yahoo公司,同年Netscape Navigator直接引用Yahoo作为其浏览器的Internet搜索引擎。此后,Yahoo快速发展,成为最广为人知的分类目录指南工具之一。如表3-1所示。

目录浏览及其首创的网络信息资源分类体系是Yahoo搜索服务的显著特点。此后,Yahoo通过与Inktomi、Google等的技术合作,也开始提供关键词检索服务。自2002年以来,Yahoo先后斥资26亿美元收购了Inktomi、Overture、Fast、AltaVista、Kelkoo共五家国际著名的搜索引擎服务商,并由此走向自主开发全文搜索技术的道路。在完成上述一系列的国际收购和技术整合后,2004年Yahoo开始推出了独立的“Yahoo Search Technology”(简称YST)。YST主要利用文本、来源、相关链接及其他特定文件的特征进行分析,以决定文件与查询的相关性。由于它不仅对网页内容进行分析,而且还分析链接结构和查询意图,这种新的搜索技术思想有望具有更强的适应性和生命力。

在经历了“搜索(目录浏览)→门户→搜索(目录浏览+关键词检索)+门户”的发展演变之后,搜索服务不仅重新回归Yahoo门户的突出位置,原有门户服务及其他业务资源也都在搜索服务的基础上进行了重新调整和整合。一些新的搜索服务项目,例如购物搜索、视频搜索等,也陆续进行了测试和发布。

目前,Yahoo已收集了约190亿网页资源,在全球共有37个网站,包括英语在内的13种语言版本,每月为世界超过1.8亿用户提供多元化的网上服务,提供的搜索服务大约占据了全球搜索服务市场份额的21%,成为继Google之后的第二大搜索工具。

表3-1 Yahoo主要搜索服务

作为目录浏览型搜索引擎的首创者,它的目录指南(Yahoo Directory)服务仍然是其最重要的特色功能之一。

经过长期的积累,目前Yahoo Directory收录的资源数量约有100万,类目体系共设置了14个基本大类,并按照(同位类)字顺方式和(上、下位类)等级方式展开呈现。