1
文献信息检索与利用
1.5.1 第一节 文献信息检索概述

第一节 文献信息检索概述

1 文献信息检索的涵义

文献信息检索(DocumentaryInformation Retrieval)指文献信息存贮与检索全过程。即根据一定方法,从已经存贮好的有关大量文献信息集合中,查出特定的相关文献信息的全过程。具体而言,就是依据特定课题的要求,利用各种检索工具如书目、题录、文摘等,按照一定的方法、步骤、途径,从数量庞大的又很分散的文献中,获取所需文献信息的过程。就其广义而论,应包括文献信息源的存贮和按一定需要检索的两个方面。

所谓文献信息的存贮,即是从信息源中,将含有一定信息价值的文献输入检索工具之中。其存贮过程即是将所存贮的文献进行标引,形成文献特征的标识,为检索提供有规律的检索途径的过程。它包括文献的著录,正文编排和附加索引等。文献“著录”,就是按既定规则,将文献的外表特征和内容特征加以描述;文献“标引”就是按文献外表和内容特征给出分类号或主题词。

所谓文献信息检索,即是从检索工具中输出(即查得)所需文献信息的过程。其检索过程即是依据需要而形成的提问标识,通过存贮过程提供的检索途径,查获与其检索提问标识相符合的文献特征标识的过程。

检索的实质就是通过文献信息的存贮和检索,使文献信息源发出的科技信息,在需要的时间内,能够迅速、及时、准确而完整地到达检索者手中。由此可见,存贮是检索的基础,检索是存贮的目的。换言之,存贮的目的是为了提供检索,而检索前提必须有存贮,二者是相辅相成的。

2 文献信息检索的基本原理

所谓文献检索,俗称“查找所需文献”。“检索”一词来源于英语即Retrieval或Search,从这两个词引意而来,其原意为“查找”、“查寻”、“追溯”。常言查找文献(即文献检索)很容易,即从浏览有关文献资料中直接获得所需文献信息,这种方法可称为直接检索。这种查法可以直接查阅原始文献,可直接获取、录用所需信息。这种方法在文献出版量较少的情况下查获率很高。但是,当今文献出版量浩大,种类繁多,使用此法费时费力,甚至查不到所需文献。从而产生了另一种间接检索方法。它是通过检索工具指引,按线索去查找。利用这种方法,可以适应当今文献出版发行形势,可以快速、全面、准确地获取信息。我们所讲的文献信息检索,即是指间接的检索。我们讨论的文献信息检索的原理即是指间接检索的原理。

文献信息检索原理,简言之,就是将检索提问标识与存贮在检索工具中文献的标引、标识进行比较,如果两者一致,或者工具中文献的标引标识包括了检索提问的标识,那么包含标引标识的工具中的文献线索、数据或文献等就输出(即检索出)这种文献信息表明为命中或切题的。

早期的文献信息检索,主要根据文献的外表和内容的特征,采用手工方式实现检索。随着计算机技术迅猛发展,引进了文献信息的检索,开辟了文献信息的信息技术的处理与检索的新时期,使文献检索逐渐进入机械化、计算机化新阶段,提高了检索速度,拓展了检索领域。详见检索原理示意图。

img3

图3-1 检索原理示意图

3 文献信息检索的类型

可按不同方式划分文献信息检索的类型。

3.1 按存贮内容与检索的对象划分

(1)文献信息线索检索

即检索工具中存贮的是书目、题录、文摘、索引等二级文献信息,用户通过检索所得到的是有关课题的一系列文献信息线索。

(2)事实检索

在检索工具中存贮的是从原始文献或有关图书中抽取的各种事实,用户通过检索,可获得有关某一事物的具体答案。这种检索也是一种确定性检索。其检索工具系指参考工具书。

(3)数据检索

该种检索系指以数值或图表表示的数据为检索对象。在检索工具中存贮着大量的数值型数据,如各种统计数据、人口数据、气象数据、企业或财政数据、科学技术常数等,并提供一定的运算推导能力。它是一种确定性检索,用户通过检索可获取经过核实、整理的数据信息。可以借此进行定量分析。而该种检索工具系指有关参考工具书。

(4)全文检索

即在检索工具(系统)中存贮的是整篇文章乃至整本图书的全部文本,用户可查出整篇文献信息或书中的章、节、段等文字。全文检索是当前计算机检索的方向,而手工检索,却不能完成存贮和检索过程。

3.2 按文献信息存贮载体及实现检索的技术手段划分

(1)手工检索

该种类型文献信息检索即是用户通过印刷型检索工具进行手翻、眼观、大脑思考作出判断来检索所需文献信息的手工方式。其优点:方便、花费代价低,且可随时修改检索标志,或检索策略,但是,检索效率较低,尤其检索庞大课题,如查找历史系列文献,费时费力,不如机检。

(2)机械检索

即通过机器或仪器来检索文献信息,目前广泛应用于计算机检索、网络检索,将在以后章节讲述。