知识回顾
1、什么叫文献?文献和信息和情报之间的关系?
2、文献的类型有哪些?
一、信息检索概述
1、定义——信息检索通常是指从任何方式组成的信息集合中,查找特定用户在特定时间和条件下所需信息的方法与过程。
因此,完整的信息检索应包括以下两个方面:
一是信息标引和存储过程,
二是信息的检索过程。
2、信息检索基本原理的核心——用户信息需求与文献信息集合的比较和选择, 是两者匹配(match)的过程。一方面是用户的信息需求,一方面是组织有序的文献信息集合。检索就是从用户特定的信息需求出发,对特定的信息集合采用一定的方法、技术手段,根据一定的线索与规则从中找出(search, locate, hit) 相关的信息。
信息检索的过程往往需要一个评价反馈途径,多次比较匹配,以获得最终的检索结果。其图示如下:
3、检索和查找的比较
检索 | 查找、搜索、搜寻 | |
英文 | Retrival或Retrieval | Search |
过程和方法 | 有一定的策略,是系统的查找资料 | 随机或更新随意一些 |
技能 | 需要一定的专门知识和技能 | 简单,任意词 |
用途 | 课题或专题 | 日常生活 |
结果 | 检索前通常不知道会有什么结果 | 通常知道结果 |
效率 | 迅速、准确 | 一般 |
如果不刻意区分:你完全可以认为他们没有区别! |
将描述特定用户所需信息的提问特征,与信息存储的检索标识进行异同的比较,从中找出与提问特征一致或基本一致的信息。
提问特征是指从欲检索课题中选择出能代表信息需求的主题词、关键词或分类号等。
检索点(access point)是检索的出发点,常被称为“检索途径”(approach )。 常用的检索途径有:
示 例 一
研究课题名称
计算机辅助工艺设计系统
提问特征
1.计算机 2.辅助工艺 3.设计系统
1、书目信息检索
概念:以标题、作者、原文来源、摘要及收藏地点为检索对象,是一种相关性检索。
特点:检索结果不直接解答课题用户提出的技术问题,只提供与之相关的线索。一般以目录、索引、文摘为检索工具。
例如:查找有关“复杂环境下机器人研究”方面的国内外信息有哪些?
检索工具:中文科技期刊数据库、EI、SCI 等。
2、全文信息检索
概念:以论文或专利说明书的全文为检索对象,也是相关性检索。
特点:书目信息检索基础上更深层次的内容检索。
例如:检索由陆小龙,赵世平,廖俊必,曹志华撰写的,发表在四川大学学报(工程科版),2010,(6)“电力铁塔攀爬机器人夹持机构设计与分析”一文。
检索工具:中国期刊全文数据库。
3、数据信息检索
概念:以具有数量性质并以数值形式表示的数据为检索对象,是一种确定性检索。
特点:检索的结果是经过测试和评价过的各种数据,可用于比较分析和定量分析。一般以数据大全、手册、年鉴等为检索具。
例如:2010年全国行政区划数据?
检索工具:中国统计年鉴 2011。
4、事实信息检索
概念:事实检索是对包括事实(fact)、数值(numericdata)与全文(full-text)的检索,提供原始信息,给出直接、确定性的答案。也是一种确定性检索。
例如:它回答的问题诸如“我国最近一年在《SCI》上被收录的文献量是多少?”“有哪些海外华人得过诺贝尔奖?”
检索工具:字典、词典(dictionary)、百科全书(encyclopedia)、 年鉴(annual, yearbook, almanac)手册(handbook, manual)、 名录(biography)和书目指南(directory)。
二. 信息检索原理
信息检索效率是评价一个检索系统性能优劣的质量标准,它贯穿于信息的存储和检索的全过程。其评价指标主要是:查全率、查准率。
信息检索系统是拥有一定的存储、检索技术装备、存储有各种信息,并能为用户检索所需信息的服务工作系统。目前常用的是:手工检索系统、计算机检索系统。
1、手工检索系统
手工检索(manual retrieval)使用的多为印刷型或书本型检索(paper-based retrieval)工具,早些有检索卡片,现在使用最多的是检索刊物,它们定期地将最新收集到的信息、文献加以汇总、组织和报道。
手检的技术要求不高,以人的劳动为本,由人来翻阅,由人来进行比较、选择,完成匹配。
手检工具能提供的检索点十分有限,检索结果往往不尽人意。
2、计算机检索系统
计算机检索系统又称现代化检索系统,是用计算机技术、电子技术、远程通信技术、光盘技术、网络技术等构成的存储和检索信息的系统。
存储时,将大量的各种信息以一定的格式输入到系统中,加工处理成可供检索的数据库。
检索时,将符合检索需求的提问式输入计算机,在数据库中进行匹配运算,然后将检索结果按要求的格式输出。
特点是:①检索速度快,节省人力和时间;②便于进行多元概念检索;③能提供远程检索。
1、定义——检索语言又称标引语言,是系统存储和检索时共同使用的一种约定语言,以达到信息存储和检索的一致性,提高检索效率。
2、检索语言的类型
3、分类检索语言的优缺点
优点:系统性强,族性检索,便于按学科、专业直接检索比较广泛的课题。查全率较高。
缺点:缺乏专指性,查准率不高,不能满足专深课题以及新兴学科、交叉学科和边缘学科知识的检索。
4、关键词和标题词(Keyword and Title)
未经严格规范化处理的检索词或词组(自然语言)。
通常是从文献的题目、摘要、正文中选取出来。
揭示文献主要内容起关键性作用。
通常是由名词、形容词等实质性词构成。
关键词的优缺点Advantages and Disadvantages of keywords
优点:自由选词,不受限制。
缺点:同义词,近义词。漏检。
例子:艾滋病(5914),爱滋病(129),艾滋(5923),HIV(3424),AIDS(773)……获得性免疫缺陷综合征(1148)[16253]。
5、主题词 SubjectHeading
经过规范化处理的具有实质性意义的词或词组。
“ 规范”:是对一个概念的同义词、近义词和拼法变异词适当归并,采用参照系统,揭示相关语义,并有主题词的范畴表和树状结构表揭示相关族性。
主题词表 SubjectList
国内医学检索工具使用:《中国中医药学主题词表》《医学主题词注释字顺表》。
国外医学检索工具:Medical Subject Headings ( MeSH,医学主题词表)。
主题词的特点Characteristics of Descriptors
规范错综复杂的名词概念,对同义词、近义词、多义词进行规范和控制。
主题词具有主题集中、学科分类的特点,故能提高文献检索的查全率和查准率。可组配副主题词提高检索的专指性。
例子:结核病/预防与控制
6、关键词语言
关键词语言是一种主题语言,它是直接从原文的标题、摘要、全文和检索课题中抽选出来的具有实质意义的。
未经规范化处理的自然语言词汇作为存储和检索依据的一种检索语言。
示 例
课题:光纤传感器在测量中的应用
关键词:光纤、传感器、测量;光纤传感器、测量
思考
1.本节介绍了文献信息检索的类型,结合自己的专业举例,举例说明自己的专业信息需求会涉及到哪些类型的文献信息检索类型?
2.本节介绍了文献检索工具的类型,结合实际生活举例说明接触的文献检索工具有哪些?
3.在实际的检索过程中会遇到漏检或者检索到大量垃圾信息的现象,当遇到这类现象的时候,应该采取什么样的检索策略?
4.通过你个人在生活中的了解,谈谈你对信息技术的了解?
5.在你的日常生活中信息技术的应用有哪些?
6.通过本节的学习,你能告诉我们图书馆图书的排列方式是什么?你查找时应该按照什么方式?这种方式属于什么检索语言?