课程门户-章节详情

数字媒体技术导论

王东

1 数字媒体技术概述
- 1.1 直播导学
- 1.2 基本概念
- 1.3 研究领域及关键技术
- 1.4 应用领域
- 1.5 本章练习
2 数字音频技术基础
- 2.1 直播导学
- 2.2 音频技术及特性
- 2.3 音频数字化
- 2.4 数字音频质量及格式
- 2.5 数字音频的处理技术
- 2.6 数字音频技术应用
- 2.7 实训1：为朗诵音频添加背景音乐
- 2.8 本章习题
3 数字图像处理技术
- 3.1 直播导学3
- 3.2 数字图像基础
- 3.3 彩色空间的线性转换
- 3.4 数字图像的描述属性
- 3.5 数字图像的获取技术
- 3.6 数字图像创意设计与处理技术
- 3.7 数字图像技术的应用
- 3.8 实训2：合成沙漠绿洲效果图
- 3.9 本章习题
4 数字视频技术
- 4.1 直播导学4
- 4.2 电影与电视
- 4.3 电视图像数字化
- 4.4 数字视频的获取
- 4.5 数字视频编辑技术
- 4.6 数字视频后期特效处理技术
- 4.7 数字视频技术的应用
- 4.8 实训3：欣赏《奇幻森林》并分析其特效
- 4.9 本章习题
5 数字动画技术
- 5.1 直播导学5
- 5.2 数字动画概述
- 5.3 二维动画技术
- 5.4 三维动画技术
- 5.5 数字动画创意与设计
- 5.6 数字动画技术的应用
- 5.7 实训4：制作单摆动画
- 5.8 本章习题
6 数字游戏技术
- 6.1 直播导学6
- 6.2 游戏概述
- 6.3 游戏设计原理
- 6.4 游戏设计相关技术
- 6.5 游戏设计案例
- 6.6 本章习题
7 虚拟现实交互技术
- 7.1 直播导学7
- 7.2 虚拟现实交互技术概述
- 7.3 虚拟建模技术
- 7.4 实时绘制技术
- 7.5 虚拟声音交互技术
- 7.6 虚拟现实工具软件与自然交互技术
- 7.7 虚拟现实交互设备
- 7.8 本章练习
8 数字媒体的Web集成与应用
- 8.1 HTML基础
- 8.2 JavaScript基础
- 8.3 Web的工作原理
- 8.4 Web的设计与规划
- 8.5 Web的开发、测试与发布
- 8.6 Web的集成技术的应用
- 8.7 本章练习
9 数字媒体压缩技术
- 9.1 数字媒体压缩技术概述
- 9.2 通用的数据压缩技术
- 9.3 数字媒体压缩标准
- 9.4 数字媒体压缩技术的应用和发展
- 9.5 本章习题
10 数字媒体存储技术
- 10.1 数字媒体存技术概述
- 10.2 存储设备及原理
- 10.3 数据库存储技术
- 10.4 分布式存储技术
- 10.5 数字媒体存储技术的应用与发展
- 10.6 本章习题
11 数字媒体管理和保护
- 11.1 数字媒体管理概述
- 11.2 媒体存储数据模型
- 11.3 数字媒体版权保护概念框架
- 11.4 数字媒体版权保护技术基础
- 11.5 数字媒体版权保护典型系统
- 11.6 本章习题
12 数字媒体传输技术
- 12.1 数字媒体传输技术概述
- 12.2 流媒体传输技术
- 12.3 P2P传输技术
- 12.4 IPTV传输技术
- 12.5 数字媒体传输技术的应用与发展
- 12.6 本章习题
13 数字媒体技术发展趋势
- 13.1 数字媒体技术发展现状
- 13.2 数字媒体内容处理技术
- 13.3 基于内容的媒体检索技术
- 13.4 数字媒体传输技术

数字媒体压缩标准

1 声音压缩标准
2 图像压缩标准
3 运动图像压缩标准

9.3.1声音压缩标准

MP3是MPEG-1的标准草案中音频编码的Layer 3。

MP3 最大特点是能以较小的比特率、较大压缩比达到近乎完美的CD音质，制作简单，交流方便。

MP3压缩编码是一个国际性全开放的编码方案,其编码算法流程大致分为时频映射、心理声学模型、量化编码三大功能模块，这三个功能模块是实现MP3 编码的关键。

下图为MP3编码框图

MP4是MPEG-2 AAC(ISO/IEC 13818-7)技术(Advanced Audio Coding)。

MP4的特点是音质更加完美而压缩比更大。它增加了诸如对立体声的完美再现、比特流效果音扫描、多媒体控制、降噪等MP3没有的特性，使得在音频压缩后仍能完美的再现CD的音质。

9.3.2图像压缩标准

JPEG是国际标准组织(ISO)和国际电工委员会（IEC）制定出的第一套国际静态图像压缩标准：ISO/IEC 10918－1号标准 “多灰度连续色调静态图像压缩编码”俗称为JPEG，以其优异的性能，该标准一直到当前仍被因特网、数码相机等很多领域广泛应用。

JPEG包含两种基本的压缩算法：无损压缩算法（基于差分脉冲调制）和有损压缩算法（基于离散余弦变换）。

JPEG算法框图

JPEG压缩编码大致分成三个步骤：

（1）使用正向离散余弦变换（Forward Discrete Cosine Transform，FDCT）把信息从空间域变换成频率域的数据，并利用数据的频率特性进行处理；

（2）使用加权函数对DCT系数进行量化，这个加权函数对于人的视觉系统是最佳的；

（3）使用霍夫曼可变字长熵编码器对量化系数进行编码。

JPEG压缩编码算法的主要计算步骤如下：

（1）正向离散余弦变换(FDCT)。

（2）量化(quantization)。

（3）Z字形编码(zigzag scan)。

（4）使用差分脉冲编码调制（differential pulse code modulation，DPCM）对直流系数（DC）进行编码。

（5）使用行程长度编码（Run Length Encoding，RLE）对交流系数(AC)进行编码。

（6）熵编码(entropy coding)。

9.3.3运动图像压缩标准

JPEG2000弥补了传统JPEG压缩技术缺陷，有以下优点：

（1）高压缩率

（2）支持无损压缩和有损压缩

（3）渐进传输

（4）对感兴趣区域压缩

1.MPEG标准

运动图像专家组MPEG是由国际标准化组织ISO和国际电工委员会IEC联合成立的，负责开发电视图像数据和声音数据的编码、解码和它们的同步标准。这个专家组开发的标准称为MPEG标准。

1.1MPEG标准-MPEG1标准

MPEG-1标准于1993年公布，用于传输1.5Mbps数据传输率的数字存储媒体运动图像及其伴音的编码。

该标准包括五个部分，分别为：系统、电视图像、音频、一致性测试和软件模拟。

MPEG-1的数据流包含：图像流、伴音流和系统流三种成分。

1.1.1MPEG标准- MPEG-1译码器

下图为MPEG-1译码器方框图。图像流包含画面信息，伴音流包含声音信息，系统流实现图像和伴音的同步，所有播放MPEG图像和伴音数据所需的时钟信息都包含在系统流中。

1.2MPEG标准- MPEG2标准

MPEG-2标准包括了系统、电视图像、音频、一致性测试、软件模拟、数字存储媒体命令和控制扩展协议、先进声音编码、编码器实时接口扩展标准、DSM-CC一致性扩展测试等。

MPEG-2的主要特点是：

1）MPEG-2解码器兼容MPEG-1和MPEG-2标准。

2）其视频数据速率为3 Mb/s～15Mb/s，基本分辨率为720×576像素，每秒可播放30帧画面。

3）可以30∶1或更低的压缩比提供具有广播级质量的视频图像。

4）允许在画面质量、存储容量和带宽之间选择，在一定范围内改变压缩比。

1.2.1MPEG标准- MPEG2系统模型

1.3MPEG标准- MPEG4标准

MPEG-4标准于1998年11月公布，是各种音频/视频对象的编码，包括了系统、电视图像、音频、一致性测试和参考软件、传输多媒体集成框架等。

MPEG-4为多媒体数据压缩编码提供的是一种格式、一种框架，而不是具体算法，以建立一种更自由的通信与开发环境。

MPEG-4的目标是支持多种多媒体的应用，特别是多媒体信息基于内容的检索和访问，可以根据不同的应用需求现场配置解码器。其编码系统也是开放的，可以随时加入新的有效的算法模块。

1.MPEG标准- MPEG4系统示意图

1.4MPEG标准- MPEG7标准

MPEG-7标准于2001年公布，称为多媒体内容描述接口，包括系统、描述定义语言、电视图像、音频、多媒体描述框架、参考软件以及一致性测试七个部分。

MPEG-7标准的目的是产生一个描述多媒体内容的标准，支持对多媒体信息在不同程度层面上的解释和理解，从而使其可以根据用户的需要进行传递和存取。

MPEG-7注重的是提供视听信息内容的描述方案，并不包括针对不同应用的特征提取方法和搜索引擎。

1.5MPEG标准- MPEG21标准

MPEG-21基于两个基本概念：分布和处理基本单元（Digital Item，DI）以及DI与用户间的互操作。

MPEG-21可表述为以一种高效、透明和可以互操作的方式支持用户交换、接入、使用甚至操作DI的技术。

DI是MPEG-21框架中一个具有标准表示、身份认证和相关元数据的数字对象。这个实体是框架中分布和处理的基本单元。

用户是指与MPEG-21进行环境交互或者使用DI的任何实体。

MPEG-21可以被看成是提供用户间交互的一个框架。

2. H.26X系列视频标准

H.26X系列视频标准是国际电信联盟ITU的视频编码专家组（ITU-T）制定的系列图像压缩标准，主要有H.261、H.263、H264等。这些视频标准主要应用于实时视频通信领域，如会议电视、可视电话等。

H.261又称Px64，传输码率为P*64kbps，其中P可变。根据图像传输清晰度的不同，传输码率变化范围在64kbps至1.92Mbps之间，编码方法包括DCT变换，可控步长线性量化，变长编码及预测编码等。

H.263是ITU-T为低于64kb/s的窄带通信信道制定的视频编码标准，其标准输入图像格式可以是S-QCIF、QCIF、CIF、4CIF或者16CIF的彩色4∶2∶0子取样图像。

H.264引入了很多先进的技术，可得到较高的压缩比，但提高了算法的复杂度。因此H.264标准中加入了去块效应滤波器，对块的边界进行滤波。

3. AVS标准

AVS（Audio Video Standards）是中国自主制定的音视频编码技术标准，其核心是把数字视频和音频数据压缩为原来的几十分之一甚至百分之一以下。

AVS标准包括系统、视频、音频、数字版权保护等四个主要技术标准和一致性测试等支撑标准。

AVS-视频当中具有特征性的核心技术包括：8x8整数变换、量化、帧内预测、1/4精度像素插值、特殊的帧间预测运动补偿、二维熵编码、去块效应环内滤波等。

图片预览