1
大学生信息素养
1.3.3.1 一、常用检索语言
一、常用检索语言

从常用角度看,检索语言按描述学术文献的出版特征可划分为内容特征语言(主题、分类)和外表特征语言(篇名、著者等);按构成原理则可划分为分类语言和主题语言。其中主题语言是研究者刚进入项目研究领域时最常用的检索语言。由于分类语言和主题语言各有不同的优缺点且互补,因而形成了这两种检索语言长期共存的局面。由于它们属于不同的语言系统,具有不同的组织原理,不可能相互取代,因而形成了彼此不同的特色。

1.分类语言

把概念按学科性质上的逻辑关系组织起来的检索语言,称为分类语言。

其特点是用分类号表达各种概念,并将各种概念按学科性质进行分类和系统排列,具有学科等级制结构特点,能够集中体现学科的系统性,反映学科之间的从属、派生、相关等关系。

分类语言是以学科分类为基础的一种信息检索语言,很好地体现了学科的系统性,较好地反映学科的纵向关系,有较高的族性检全功能,适合查找某一类的文献的检索,比如:“检索2009年船舶工程方面的最新文献”就可以借助《中图法》找到“船舶工程”对应的分类号进行检索,也可以利用其分类导航系统通过“交通运输”—“水路运输”—“船舶工程”类目的逐层查找来找到所需要的文献内容,两种方法都可以将有关“船舶工程”类目的所有相关文献找出来。

分类语言也是目前国内手工检索工具组织文献的主要方式。与此同时,分类语言也存在一定的缺陷。首先它使用的标识符号是号码,在检索文献时需要将检索需求转换成相应的分类号码(即主题概念—学科概念—分类号码)。例如,查找有关“船舶设计方面”的文献资料,首先要提取课题的主题概念“船舶设计”,然后将其转换成所属学科(U大类),再按照分类表转换成学科概念及相应的分类号(U662),才能到检索工具中进行检索。

2.主题语言

主题语言是一种描述语言,即用自然语言中的名词、名词性词组或句子描述文献所论述或研究的事物概念。

主题语言主要包括标题词、关键词和叙词三种。

(1)标题词语言

这是主题法语言中最早出现的一种,它是采用经过词汇控制的比较定型的事物名称和名词术语作为标识,来直接表达文献所论及或涉及的事物(主题)。

标题词语言一般采用单级标题和多级标题两种,在多级标题中主标题与副标题的搭配一般也为固定的。在编制标题词表时,列举的所有作为标题词的规范化语言均按字顺排列。用户在利用相应的检索工具进行检索时,必须遵循词表中已经规定的组配进行。如《工程索引》(EI)的印刷版的正文就是依据标题词排列,并单独编辑出版它的标题词表。

(2)关键词语言

它直接选用文献标题、文摘或正文中有实质意义的并能揭示文献主题内容的词或词组来标引和检索文献的主题概念,是一种自然语言的形式。

关键词语言最大的优点是选词方便、快捷,尤其在新技术、新理论层出不穷的今天,有些词表的发展是无法满足的,因此它被广泛地应用在计算机检索中。

但是,关键词未经过规范化的处理,直接取自文献的题目和内容等,每个词都可以作为检索标识,检索时容易造成误检;同时,表达同一概念的词(如计算机与电脑)标引时采用不同的词,在检索时还容易造成漏检。有些计算机检索系统增加了同义词库,如维普(中文科技期刊数据库》就采用同义词库来解决同义词的问题。

(3)叙词语言

叙词是指具有组配功能并经过规范化处理的表示单元概念的名词或名词性的词、词组。通过叙词作为存贮和检索文献的标识系统称为叙词语言。

叙词语言是主题词语言的高级形式,它将经过严格规范化处理的自然语词作为概念组配单元的标识,用来存贮和检索文献,叙词在检索工具的实际应用中也常常被直接称为主题词。叙词语言普遍应用计算机检索中,一般在检索系统中会提供一个“叙词表”,它一般会通过“检索词字典”“检索词索引”等体现出来。