第二节 图书馆馆藏文献数字化工作
馆藏文献数字化,指图书馆利用多媒体技术、数据库技术、数据压缩技术、光盘存储技术、网络技术等技术手段,将馆藏印刷型文献、缩微型文献、音像型文献等传统介质的文献,转化为数字化、电子化的光盘文献或网络信息的工作。
一、数字化文献信息的特征
是以计算机可读数据的形式加以表示的,载体是磁性或光学信息存储介质,生产和使用必须借助于计算机等信息处理设备进行,发行方式可以是电子出版物方式,也可以是网页浏览、联机数据库查询等在线服务形式。
优点:存储信息量大、体积小、密度高、节省空间;传播速度快;价格便宜;信息资源利用频率高,使用范围广;方便快捷的检索功能,便于自动化管理;种类形式多样化;节省自然资源,减少环境污染。
缺点:数字化文献的保存寿命有限;依赖软硬件设备,不能直接阅读;格式标准统一难;存储的信息易受到干扰和破坏。
二、图书馆馆藏文献数字化的意义
三、我国文献数字化建设工作的进展
1.光盘引进后逐步利用阶段
2.二次开发利用阶段
3.自行研制阶段
四、我国图书馆文献数字化中的关键性技术问题
1.数字化文献生产的组织机构
2.数字化文献的选题
① 应注意将本馆所藏特色文献转化为数字化文献;
② 在文献数字化中,既要考虑文化保存和传播功能,又要考虑市场效益;
③ 加强数字文献资源建设中的协调与合作,避免重复开发建设。
④ 在选题和进行总体规划时,要进行深入的国内外市场需求调查。
3.数字化文献的主要类型
在将传统文献转化为数字文献时,主要有两种数据存贮形式:
①采用扫描录入方式将文献或图片资料按原貌逐页存贮为图像文件,并为其编制索引,利用索引可以检索并显示索引词所在页面的图像文件。
② 用文本方式存贮文献内容、辅之以全文检索系统构成的全文检索数据库。
也可以将上述两种存贮方式结合起来,即全文版挂接扫描版。
4.文献录入技术
① 用扫描录入方式存贮数据,可以利用扫描仪和市场上成熟的扫描软件来实现
② 文本方式录入方式
5.支持全文检索的汉字库容量问题
6.数字化文献的后期制作工作
五、文献数字化工作面临的迫切问题及解决方案
1.数字化文献市场开拓与投资方式中的问题
由于我国数字化文献的市场尚在拓展之中,真正商品化的数字化文献市场机制还不完善。
2.数字化文献的版权问题
目前我国有关的数字化文献开发生产机构版权观念不强,主要体现在向原创者支付版权费用方面意识较差,不经允许即直接采用原始资料,或以少量经济补偿的办法获得使用权。
3.数据库生产中有待解决的其他关键技术问题
① 提高数据库检索效率问题
② 自动标引与汉语字词的自动切分问题
③ 简体数据库转换为繁体数据库的问题
④ 数字化文献上网传播时的加密问题和收费使用问题
4.图书馆在数字化文献建设中应当加强统一规划,进行协调共享,避免重复浪费
5.处理好文献数字化工作中学术性与商业性的矛盾
六、国外文献数字化工作
Google、Million Bookproject、MSN和Yahoo中进行大规模的数字化。

