1
大学生信息素养
1.3.3.2 二、检索词的提取
二、检索词的提取

检索词的提取应选用各学科的专业术语,不能用通俗用语;应选用意义明确的词汇,不用一般的、通用性的词汇,应充分利用规范词(叙词或主题词)。在提取检索词时,通常包含切分、删除、补充等步骤。

1.切分

对课题语句进行切分,即以词为单位划分句子。切分一定要彻底,必须到词为止,同时也要适度,不能因切分而改变语义。

例:查询课题“基于DSP芯片TMS320DM642开发的虹膜识别系统”,我们对课题进行切分到词:

基于| DSP |芯片| TMS320DM642 |开发|的|虹膜|识别|系统

2.删除

在提取检索词时,应删除没有意义的虚词,删除过分宽泛和过分具体的限定词,删除存在蕴涵关系的可合并词。在“基于DSP 芯片TMS320DM642 开发的虹膜识别系统”的课题中,删除“基于”“的”等虚词,删除“系统、开发”这样的过于宽泛的词,同时由于“TMS320DM642”是DSP芯片的一种具体型号,它与DSP芯片存在蕴涵关系,所以也应该删除。那么,提出的检索词就为:

DSP|芯片|虹膜|识别|

3.补充

为了保证我们检索的结果全面,我们在切分、删除以后,还要补充出检索词的同义词、相关词等,保证检索结果全面。

(1)补充同义词或相关词,补充原词或缩略语

例:基于DSP 芯片TMS320DM642 开发的虹膜识别系统

补充DSP的全称:数字信号处理(digital signal processing)

(2)补充同一词的不同拼写

例如:虹膜识别为iris recognition 或 iris identification

(3) 补充同类词

例:第四代飞机(第4 代飞机):补充典型型号,如F-22、F-35,等等。

(4)补充限定词

一词多义是一个普遍现象,为避免一词多义而导致的误检,应增加限义词,其方法有两种:用逻辑与增加限定词;用逻辑非排除异义词。

电子科技大学 电子科技大学*成都

电子科技大学 电子科技大学-(西安+杭州+桂林)