学习目标:
1.理解音频压缩编码标准
2.掌握静止图像压缩编码标准
3.掌握运动图像压缩编码标准
视频学习:
电子教材:
数据压缩标准
音频压缩编码标准
音频信号可分成电话质量的语音、调幅广播质量的音频信号和高保真立体声信号。针对不同的音频信号,ITU-T和ISO先后提出了一系列的有关音频压缩编码的建议。这些标准广泛地用于多媒体技术和通信中
1.电话质量的语音压缩标准
电话质量语音信号的频率范围是300Hz~3.4khz,采用标准PCM。当采样频率为8khz,量化位数为8bit时,对应的速率为64kb/s。为了压缩音频数据,国际上从ITU-T最初的G.711 64kb/s码率PCM编码标准开始,制定一系列的语音压缩编码的标准。这些压缩标准中充分利用了线性预测技术、矢量量化技术和综合分析技术,典型的算法有ADPCM、码本激励线性预测编码(CELP)、短时延码本激励线性预测编码(LD-CELP)、长时线性预测规则码激励(RPE-LTP)、矢量和激励线性预测编码(VSELP)等。随着数字移动通信的发展,人们对于低速语音编码有了更迫切的要求。1983年欧洲数字移动特别工作组(GSM)制定了采用长时线性预测规则码激励(RPE-LTP)压缩技术的GSM编码标准,作为一种移动电话的压缩标准。8kb/s和13kb/s的语音压缩标准具有较大的压缩率和较高的语音质量,应用前景广泛。
2.调幅广播质量的音频压缩标准
调幅广播质量音频信号的频率范围是50hz~7khz,又称“7khz 音频信号”,当使用16khz的抽样频率和14bit的量化位数时,信号速率为224kb/s。1988年ITU制定了G.722标准,它可把信号速率压缩成64kb/s。
(1)G.722标准:1988年,64kb/s,从采样频率为16khz,量化为14bit的224kbps中压缩而来,可以在窄带ISDN中传送调幅广播质量的音频信号。
(2)MPEG标准:MP3。
(3)AC-3标准:5.1声道(6声道):左、中、右、左环绕、右环绕、低频增强(频率在20~120HZ,0.1声道),采样频率为48khz,量化位数为16~22bit。
静止图像压缩编码标准
1.JPEG标准
JPEG(Joint Photographic Experts Group)即联合图像专家组,该组织负责制定静态图像的编码标准。
1992年JPEG推出了ISO/IEC 10918标准(CCITT T.81)——连续色调静态图像的数字压缩与编码,简称为JPEG标准,适用于灰度图与真彩图的静态图像的压缩。
2000年JPEG在JBIG(Joint Bi-Level Image Experts Group联合二值图像专家组)的帮助下又推出了比JPEG标准的压缩率更高、性能更优越的JPEG 2000标准,适用于二值图、灰度图、伪彩图和真彩图的静态图像压缩。
JPEG主要采用了以DCT为基础的有损压缩算法。JPEG 2000则采用的是性能更优秀的小波变换。
由于视频的帧内编码就是静态图像的编码,JPEG和JPEG 2000的算法也用于MPEG的视频编码标准中。
2.JPEG专家组开发了两种基本的压缩算法。
(1)以DCT为基础的有损压缩算法。
使用有损压缩算法时,在压缩比为25:1的情况下,压缩后还原得到的图像和原始图像进行比较,非图像专家难以找到它们之间的区别,因此得到了广泛的应用。如在V-CD和DVD-Video电视图像压缩技术中,使用JPEG的有损压缩算法,消除空间冗余数据。基于DCT的JPEG压缩算法是有损压缩,它利用了人的视觉系统的特性,使用量化和无损压缩编码相结合,消除视角的冗余信息和数据本身的冗余信息。
(2)以预测技术为基础的无损压缩算法。
使用无损压缩算法时,压缩比较低,但保证图像不失真。
3.在JPEG标准中定义了四种编码模式。
(1)DCT顺序模式
DCT顺序模式的基本算法是将图像分成8×8的块,然后进行DCT变换、量化和熵编码(哈夫曼编码)。这种模式每个图像分量的编码是一次扫描完成的。
(2)DCT渐进模式
DCT渐进模式采用的算法与DCT顺序模式相类似,不同之处在于对图像进行多次扫描,先传送部分DCT系数信息(如低频带的系数或所有系数的近似值),使接收端尽快获得一个“初略”的图像,然后再将剩余频带的系数渐次传送,最终形成清晰的图像。
(3)无失真编码模式
无失真编码模式采用一维或二维的空间域DPCM和熵编码。由于输入图像已经是数字化的,经过空间域的DPCM之后,预测误差值也是一个离散量,无需再次量化,即可实现无失真编码。
(4)分层编码模式
分层编码模式是对一幅原始图像的空间分辨率,分成多个分辨率进行“锥形”的编码方法,水平(垂直)方向分辨率的下降以2的倍数因子改变。分层编码模式先对分辨率最低的一层图像进行编码,然后将该层图像作为下一层图像的预测值,再对预测误差进行编码,以次类推,直到底层。
运动图像压缩编码标准
视频编码的国际标准包括计算机与网络领域的MPEG系列标准与电子、通信领域的H.26x系列标准。目前,被国际社会广泛认可和应用的通用压缩编码标准主要有H.261、JPEG、MPEG等。
1.H.261
H.261是由CCITT(国际电报电话咨询委员会)制定,用于音频/视频服务的视频编码/解码器(也称Px64标准)。它使用两种类型的压缩方式:一是基于DCT的帧画面的有损压缩,二是用于帧画面间的无损压缩。在此基础上使编码器采用带有运动估计的DCT和DPCM(差分脉冲编码调制)的混合方式。这种标准与JPEG及MPEG标准有明显的相似性,但关键区别在于它是为动态使用设计的,并提供完全包含的组织和高水平的交互控制。
2.JPEG
JPEG的全称是Joint Photogragh Coding Experts Group(联合照片专家组),它采用基于DCT的静止图像压缩和解压缩算法,由ISO(国际标准化组织)和CCITT(国际电报电话咨询委员会)共同制定的国际标准。JPEG把冗长的图像信号和其他类型的静止图像去掉,可以减小到原图像的1%(压缩比100:1)。
3.MPEG
MPEG的全称是 Moving Pictures Experts Group(动态图像专家组),它实际上是指一组由ITU和ISO制定发布的视频、音频、数据的压缩标准。它采用的是一种减少图像冗余信息的压缩算法,压缩比高达200:1,同时图像和音响的质量也非常高。现在通常有三个版本:MPEG-1、MPEG-2、MPEG-4,以适用于不同带宽和数字影像质量的要求。它的三个最显著优点就是兼容性好、压缩比高,数据失真小。
编码标准 | 结构 | 应用 | 码率 |
MPEG-1 | 运动图像及伴音 | VCD、视频监控等 | 低于1.5MB/S |
MPEG-2 | 运动图像及伴音 | 数字电视、卫星电视、DVD | 1.5-35MB/S |
MPEG-4 | 音视频对象 | Internet、交互视频、移动通信 | 8Kb/S-35MB/S |
H.261 | P×64KB/S视频 | ISDN视频 | P×64KB/S |
H.263 | 低比特率视频 | POTS视频无线视频电话/会议 | 8Kb/S-1.5MB/ |

