1
文献信息 检索教程  第2版
1.1.4.1 1.4.1 信息检索语言的概念及作用
1.4.1 信息检索语言的概念及作用

1.信息检索语言的概念

为了存储有序、查找方便,世界各国都在创造各自的检索语言。这种人工语言就是从自然语言中精选出来并加以规范化的一套词汇符号,是概括文献信息内容或外在特征及其相互关系的概念标识体系,是沟通文献信息存储和检索两个过程中信息标引人员和信息检索人员双方思路的桥梁,又是编制检索工具的各种索引的依据,也是计算机化的信息存储系统用以表达文献信息主题概念和检索课题概念的人工语言。从某种意义上来说,它是一种文献信息识别的符号体系。

2.文献信息检索语言的基本要求

检索语言是情报检索专用的人工创造的书面语言,而不是人们普遍使用的普通语言,因此,它除了具备普通语言的特点外,还有一些基本要求:

(1)检索语言应当接近于自然语言,应当由利于检索者理解和掌握的词汇、词法和句法组成。虽然检索语言是专供检索者查找文献而用的,但检索者不可能都是经过专门训练的,这就要求检索语言来自自然语言。

(2)检索语言应当便于计算机识别和处理。一般地说,计算机只能读出和比较各种代码,告诉检索者比较的结果是否匹配,而不可能找出检索语言中的语义含混和逻辑错误。这就要求检索语言比自然语言更严格。

(3)检索语言应当能够适应计算机程序分析能力。现在越来越多的索引是由计算机编制的,机编索引程序的分析能力有限,虽然能够从文本中抽取合适的语词或句子,形成检索词和摘要,却不能创造和修改句子。因此,设计检索语言要与计算机程序分析能力联系起来加以考虑。

(4)检索语言应当充分考虑索引的经济效益。网罗性和专指性是检索语言的重要特性,但是,过分强调网罗性和专指性,就可能降低检索速度和提高编制成本,就要以牺牲检索速度和编制成本为代价,因此,要在这两个方面进行权衡。

(5)检索语言应当能够及时更新。科学技术在不断发展,文献用语和提问用语也是动态变化的,与之相适应,检索语言也要跟上时代的步伐,及时吸收新概念、新词汇,淘汰过时的概念和词汇。

(6)检索语言中的语词应当有相应的文献和提问作保障。检索语言是供标引和检索使用的,它必须满足标引和检索的实际需求,因此,检索语言中的语词必须是来自文献和提问的,有相应的文献和提问存在。如果检索语言中的语词既不是文献使用的,也不是提问使用的,那么就不适合检索语言。这恰恰是检索语言与各学科领域中的概念的区别所在,也是不同于自然语言的重要一点。

3.信息检索语言的作用

检索语言的作用是沟通信息标引者和检索者,使标引人员和检索者在不同时候和不同情况下在描述同一信息特征时保持一致。由于信息检索的匹配过程是通过检索语言的匹配过程来实现的,检索语言的质量好坏以及对它的使用正确与否,就直接影响检索率的高低。检索语言所起到的作用是:

(1)它保证不同的信息标引人员描述信息特征的一致性。信息标引人员出于自身的学历、专业、经历、理解、思维方式的不同,在对同一事物进行描述时,会产生不一致性、专用的检索语言力求在最大限度地避免这种不一致性的产生。

(2)它保证检索提问词与信息标引的一致性。检索者和标引人员对同一事物的理解是不一致的,检索语言在检索者和标引人员之间架起桥梁,保证检索提问词和标引词的一致性。

(3)它保证检索者按不同的信息需求来检索信息时能够获得较高的查全率和查准率。检索者的信息需求类型是多种多样的,获得信息的途径也是多方面的,检索语言应力求将信息检索中的漏检现象和误检现象控制到最低限度。