4.2音频
在多媒体作品中,声音是非常重要的一个要素。我们生活的环境中的声音是多种多样的,比如人的语音、动物的叫声、优美的乐器声、以及自然界的雷雨声等等。音频处理技术是多媒体技术的一个重要分支。
4.2.1 声音的特性
1.声音的概念及基本特征
声音的定义:声音是由物体的振动产生的,是一种机械振动波。可以用正弦波y=Asin(x)或余弦y=Acos(x)来模拟表示。声源:是一种振动源,它使周围的介质产生振动,并以波的形式进行传播。传播介质:主要指空气、液体、固体等。声音的分类:根据声波的特征,可以将其分为规则声音和不规则声音。其中规则声音又可以分为语音、音乐和音效。不规则声音指的是噪音。
2.声音的三要素
(1)音调
也称音高,表示人耳对声音调子高低的主观感受。
(2)音强
又称响度或音量,它表示声音能量的强弱程度,主要取决于声波振幅的大小。
(3)音色
又称为音品,主要由声音波形的谐波频谱决定。
3.声音的基本表示形式
(1)模拟音频信号:所谓模拟音频是指用电信号(电压、电流)来模仿声音物理量的变化。
(2)数字音频信号:以数字化形式对模拟信号进行处理,它在时间和幅度上都是离散的。
4.声音的应用
人可听到的频率范围:20Hz〜20kHz。低于20Hz为次声波;高于20kHz为超声波。
(1)超声波的应用
(2)次声波的应用
4.2.2 模拟音频的数字化
自然界的声音是一种模拟的、连续的音频信息。而计算机只能处理离散的数字量,这就必须将声音数字化。
1.采样
每隔一定时间间隔不停的间断性地在模拟声音波形上取一个幅度值。而每个采样所获得的数据与该时间点的声波信号相对应,称为采样样本
2.量化
在数字音频技术中,把表示声音强弱的模拟电压用数字表示。而用数字来表示音频幅度时,只能把无穷多个电压幅度用有限个数字表示。即把某一幅度范围内的电压用一个数字表示。
3.编码
即编辑,把量化数据写成计算机的数据格式,即二进制格式。
常见的方案有如下几种:
(1)第一代全频带声音编码
(2)第二代全频带声音压缩编码
4.2.3数字音频的技术指标
1.采样频率
采样频率也称为采样速度或者采样率,指每秒从连续信号中提取并组成离散信号的采样个数,是描述声音文件的音色、音调,衡量声卡、声音文件的质量标准。
2.量化位数
量化位数指模拟量转换成数字量之后的数据位数。
3.声道数
声道数指处理的声音是单声道还是立体声。
4.编码算法
编码算法的作用是可以采用一定的格式来记录数据和压缩数据。压缩程度越大,信息丢失越多,信号还原后失真越大。采样频率、量化位数和声道数是决定音频质量和存取容量的重要指标。
4.2.4数字音频的文件格式
在计算机领域,文件格式指的是文件编码类型和文件的结构。常见的数字音频文件格式如下:
1.WAV格式
2.MP3格式
3.MIDI格式
4.AIFF格式
5.CDA格式
6.WMA格式
7.RealAudio格式
8.OGG格式
9.FLAC格式
10.APE格式
11.AAC格式
12.VOC格式
4.2.5数字语音的应用
语音合成和语音识别技术是实现人机语音通信,建立一个有听和讲能力的口语系统所必需的两项关键技术。使电脑具有类似于人一样的说话能力,是当今时代信息产业的重要竞争市场。
1.语音识别
2.语音合成

