-
1 教学内容
-
2 视频教程
随着计算机技术的发展,计算机多媒体技术已经深入我们的生活,给我们带来了无穷的乐趣。本节将简单介绍多媒体技术的小知识。
2.1.3.1 多媒体的概念及特点
媒体(Media)是信息的表示和传输的载体。多媒体技术,是计算机交互式综合处理多媒体信息——文本、图形、声音、视频等,使多种信息建立逻辑连接,集成为一个具有交互性的系统。多媒体技术的实质就是将以各种形式存在的媒体信息数字化,用计算机对它们进行组织加工,并以友好的形式交互地提供给用户使用。
与传统媒体相比,多媒体具有交互性、集成性、多样性、实时性等特点。
(1)交互性
交互性是指多媒体系统向用户提供交互式使用、加工和控制信息的手段,从而可应用于更加广阔的领域,为用户提供了更加自然的信息存取手段。在多媒体系统中用户可以主动地编辑、处理各种信息,具有人机交互功能。交互可以增加对信息的注意力和理解力,延长信息的保留时间,是多媒体技术的关键特征。
(2)集成性
多媒体技术中集成了许多单一的技术,如图像处理技术、声音处理技术等。多媒体能够同时表示和处理多种信息,但对用户而言,它们是集成一体的。这种集成包括信息的统一获取、存储、组织、合成等方面。
(3)多样性
多媒体信息是多样化的,同时也指媒体输入、传播、再现和展示手段的多样化。多媒体技术使人们的思维不再局限于顺序、单调和狭小的范围,这些信息媒体包括文字、声音、图像、动画等,它扩大了计算机所能处理的信息空间,使计算机不再局限于处理数值、文本等,使人们能得心应手地处理更多种信息。
(4)实时性
实时性是指在多媒体系统中,声音及活动的视频图像是实时的,是多媒体系统的关键技术。多媒体系统提供了对这些媒体实时处理和控制的能力。多媒体系统是能够综合地处理带有时间关系的媒体,如音频、视频和动画,甚至是实况信息媒体。这就意味着多媒体系统在处理信息时有着严格的时序要求和很高的速度要求。
2.1.3.2 多媒体个人计算机
多媒体个人计算机(Multimedia Personal Computer,MPC)是一种可以对多媒体信息进行获取、编辑、存储、处理和输出的计算机系统。
配置一台多媒体计算机需要如下部件:
●一台高性能的微机。
●一些多媒体硬件,包括CD-ROM驱动器、声卡、视频卡、音箱(或耳机),另外可以根据需要安装视频捕获卡、语音卡等插件,或安装数码相机、数字摄像机、扫描仪与触摸屏等采集与播放视频音频的专用外部设备。
●相应软件:支持多媒体的操作系统(如Windows XP/Vista/7等)、多媒体开发工具和压缩/解压缩软件等。
2.1.3.3 媒体的数字化
在计算机和通信领域,最基本的3种媒体是声音、图像和文本。
1.声音的数字化
计算机系统通过输入设备输入声音信号,通过采样、量化将其转换成数字信号,然后通过输出设备输出。采样是指每隔一段时间对连续的模拟信号进行测量,每秒钟的采样次数即为采样频率。采样频率越高,则声音的还原性就越好。量化是指将采样后得到的信号转换成相应的数值表示,转换后的数值以二进制的形式表示。量化位数一般为8位、16位。量化位数越大,采集到的样本精度越高,所需的存储空间也就越大。
采样和量化过程中使用的主要硬件是A/D转换器(模拟/数字转换器,实现模拟信号到数字信号的转换)和D/A转换器(数字/模拟转换器,实现数字信号到模拟信号的转换)。
经过采样、量化后,还需要进行编码,即将量化后的数值转换成二进制码组。编码是将量化的结果用二进制数的形式表示。有时也将量化和编码过程统称为量化。
最终产生的音频数据量按照如下公式计算:
音频数据量(B)=采样时间(s)×采样频率(Hz)×量化位数(b)×声道数/8
存储声音信息的文件格式有很多种,包括WAV文件、MIDI文件、VOC文件、AU文件以及AIF文件等。
2.图像的数字化
图像是多媒体中最基本、最重要的数据,图像有黑白图像、灰度图像、彩色图像、摄影图像等。在自然界中,景和物有两种形态,即动和静。静态图像根据其在计算机中生成的原理不同,分为矢量图形和位图图像两种。动态图像分为视频和动画。
(1)静态图像的数字化
一幅图像可以近似地看成是由许多点组成的,因此它的数字化通过采样和量化就可以得到。图像的采样是指采集组成一幅图像的点。量化是指将采集到的信息转换成相应的数值。组成一幅图像的每个点称为一个像素,每个像素的值表示其颜色等属性信息。存储图像颜色的二进制数的位数,称为颜色深度。
(2)动态图像的数字化
人眼看到的一幅图像消失后,还会在视网膜上滞留几毫秒,动态图像正是依据这样的原理,将静态图像以每秒钟n幅的速度播放,当n≥25时,显示在人眼中的就是连续的画面。
(3)点位图和矢量图
表达或生成图像通常有点位图和矢量图两种方法。点位图是指将一幅图像分成很多小像素,每个像素用若干二进制位表示像素的颜色等属性信息。矢量图是指用一些指令来表示一幅图,如画一条200像素长的红色直线、画一个半径为100个像素的圆等。
(4)文件格式
图像文件的格式包括:BMP、GIF、TIF、PNG、WMF、DXF等。
视频文件格式包括:AVI、MOV等。
2.1.3.4 多媒体的数据压缩
由于多媒体信息数字化后数据量非常大,因而需要经过压缩才能满足实际需求。
数据压缩分为无损压缩和有损压缩两种类型。
1.无损压缩
无损压缩是利用数据的统计冗余进行压缩,又称可逆编码,其原理是统计被压缩数据中重复数据的出现次数进行编码。无损压缩能够确保解压后的数据不失真,是对原始对象的完整复制。
其主要特点是压缩比通常较低,通常广泛应用于文本数据、程序以及重要图形和图像的压缩。常用的无损压缩算法如下。
(1)行程编码
行程编码(Run-Length Encoding, RLE)简单直观,编码和解码速度快;其压缩比与压缩数据本身有关,行程长度大,压缩比就高。它适于计算机绘制的图像,如BMP、AVI格式文件。对于彩色照片,由于色彩丰富,采用行程编码压缩比会较小。
(2)熵编码
根据信源符号出现概率的分布特性进行码率压缩的编码方式称为熵编码,也称统计编码。其目的是在信源符号和码字之间建立一一对应关系,以便在恢复时能准确地再现原信号,同时要使平均码长或码率尽量小。熵编码包括霍夫曼编码和算术编码。
霍夫曼编码是依据字符出现的概率来构造异字头的平均长度最短的码字,又称最佳编码。它将文件中出现频率较高的符号用短的位序列替代,而将那些很少出现的符号,用较长的位序列替代,一般用来压缩文本和程序文件。
算术编码与其他编码方法的不同之处在于其直接将整个输入的消息编码为一个小数n(0≤n<1.0)。
算术编码的优点是每个传输符号不需要被编码成整数“比特”。虽然算术编码实现方法复杂一些,但通常算术编码的性能优于霍夫曼编码。
人们每天从互联网接收的信息中,图像和视频占据了大部分,JPEG、MPEG作为常见的图像、视频格式,具有占据存储空间小、清晰度高等优点,被广泛应用于互联网信息传播中。JPEG标准是为静态图像所建立的第一个国际数字图像压缩标准,也是至今应用最广的图像压缩标准。JPEG标准可以提供有损压缩,其压缩比是其他传统压缩算法无法比拟的。MPEG标准是一种高效的压缩标准,它规定了声音数据和电视图像数据的编码和解码过程、声音和数据之间的同步等问题。MPEG-1和MPEG-2标准为数字电视标准;MPEG-4是基于内容的压缩编码标准;MPEG-7是“多媒体内容描述接口标准”;MPEG-21是有关多媒体框架的协议。
2.有损压缩
有损压缩又称不可逆编码,是指压缩后的数据不能够完全还原成压缩前的数据,与原始数据不同但是非常接近的压缩方法。有损压缩也称破坏性压缩,以损失文件中某些信息为代价来换取较高的压缩比,其损失的信息多是对视觉和听觉感知不重要的信息,但压缩比通常较高,常用于音频、图像和视频的压缩。
典型的有损压缩编码方法如下。
(1)预测编码
预测编码是根据离散信号之间存在着一定相关性的特点,利用前面一个或多个信号对下一个信号进行预测,然后对实际值和预测值之差进行编码和传输。在接收端把差值与实际值相加, 恢复原始值。在同等精度下,用比较少的“比特”进行编码,以达到压缩的目的。预测编码中典型的压缩方法有脉冲编码调制(PCM)、差分脉冲编码调制(DPCM)、自适应差分脉冲编码调制(ADPCM)等。
(2)变换编码
变换编码是指先对信号进行某种函数变换,从一种信号空间变换到另一种信号空间,然后再对信号进行编码。变换编码包括变换、变换域采样、量化和编码四个步骤。典型的变换有离散余弦变换(DCT)、离散傅里叶变换(DFT)、沃尔什-哈达码变换(WHT)、小波变换等。量化将处于取值范围X的信号映射到一个较小的取值范围Y中,压缩后的信号比原信号所需的比特数减少。
(3)基于模型编码
如果把预测编码和变换编码这种的基于波形的编码称为第一代编码技术,则基于模型编码就是第二代编码技术。其基本思想是:在发送端,利用图像分析模块对输入图像提取紧凑和必要的描述信息,得到一些数据量不大的模型参数;在接收端,利用图像综合模块重建原图像,对图像信息进行合成。
(4)分形编码
分形编码是利用分形几何中的自相似原理来实现的。首先对图像进行分块,然后寻找各块之间的相似形(由仿射变换确定,一旦找到了每块的仿射变换,就保存这个仿射变换的系数)。由于每块的数据量远大于仿射变换的系数,因而图像得以大幅度的压缩。
(5)矢量量化编码
矢量量化编码是在图像、语音信号编码技术中研究得较多的新型量化编码方法之一。矢量量化是一种限失真编码,其原理仍可用信息论中的信息率失真函数理论来分析。

