1
计算机应用基础
1.12.3.1 一、数据冗余与压缩
一、数据冗余与压缩

通常所讲的多媒体信息主要包括文本信息、音频信息和视频信息等,其中视频信息是由大量的单幅静态的图形或图像信息构成的。在计算机中,所有的信息都是以数据编码的形式储存的。

在这些信息的编码中,存在大量的数据冗余(指在一个数据集合中重复的数据)。比如,某张图片中有大面积的颜色、饱和度等是相同或相近的,若以位图方式保存将有大量存储内容是相同或相似的;视频中一段时间的画面内容相似度很高,那么这段视频信息中将存在大量相同的数据;视频或音频中的部分信息由于人类感知系统的局限是感知不到的;字母“e”在英语中比字母“z”使用频率高很多,如果计算机中用来表示“e”的编码较长,那么相应的文本信息需要的存储空间就会增加。这些数据的冗余可以通过调整编码的方式来减少,而且不会丢失信息或在允许的范围内丢失少量数据,这样就可以节省存储的空间和传输的时间。

数据压缩是将数据按照特定的编码机制重新进行编码,以减少所需存储空间的操作过程。数据的压缩过程是可逆的,可以将压缩的数据恢复或者基本恢复成原状,这个过程称为展开或者解压缩。

利用数据压缩的原理可以将一个或多个文件压缩成一个占用存储空间较少的文件,这个过程称为文件压缩。文件压缩和解压缩可以借助相关的软件实现,压缩比是衡量压缩效果好坏的一个重要指标。它是指压缩后的文件与原文件的存储空间之比,比如压缩比为10∶1则说明压缩后的文件是原文件的1/10。而文件压缩比不但取决于压缩算法,与原文件的格式也有很大关系。比如,可以将位图文件压缩70%左右,而JPG文件本身就是一种压缩格式很难再进行压缩。