7.3 图像信息处理
图形与图像是人们非常乐于接受的信息载体,是多媒体技术的重要组成部分。 一幅图像可以形象生动地表示大量的信息,具有文本和声音所无法比拟的优点。 因此,了解图形图像处理的相关知识是非常必要的。
7.3.1 图形和图像
在计算机领域,图形(Graphic)和图像(Picture或Image)是两个不同的概念。
1.图形
图形又称为矢量图形,是计算机根据数学模型计算而生成的几何图形,如直线、圆、矩形、任意曲线和图表等。 图形是由点、线、二维或三维图片构成的,构成图形的点、线和面由坐标及相关参数生成,如用Illustrator、CorelDRAW等软件绘制的图形。 图形的优点是可以不失真地缩放、占用存储空间小。 但矢量图形仅能表现对象结构,其对象质感方面的能力较弱。
2.图像
图像指由输入设备捕获的实际场景画面或以数字化形式存储的自然画面,是真实物体重现的影像。 计算机对图片逐行、逐列进行采样(取样点),用光点(称为像素点)表示并存储,所成的图像即为数字图像,又称为位图(Bitmap)或点阵图。
图像主要用于表现自然景色、人物等,能表现对象的颜色细节和质感,具有形象、直观、信息量大的优点。 目前,最为流行、压缩效果较好的位图压缩格式为JPEG,其压缩比高达30∶1,且图像失真较小。
图形和图像的共同特点是二者都是静态的,和时序无关。 它们之间的差别如下:图形是用一组命令通过数学计算生成的,这些命令用来描述画面的直线、圆、曲线等的形状、位置、颜色等各种属性和参数;而图像是通过画面上的每一个像素的亮度或颜色来形成画面的。 图形可以容易地分解成不同成分单元,分解后的成分间有明显的界限;但要将图像分解成不同的成分比较难,各个成分间的分界往往有模糊之处,有些区间很难区分应该属于哪个成分,它们彼此平滑地连接在一起。
当图形很复杂时,计算机需要花费很长时间去执行绘图指令。 此外,矢量图形也很难描述一幅真实世界的彩色场景,因此,自然景物适合用位图表示。
矢量图与位图相比,显示位图要比显示矢量图快。 矢量图和位图之间可以用软件进行转接,由矢量图转换成位图时应采用光栅化(Rasterizing)技术,这种转化相对容易一些;由位图转换成矢量图应用跟踪(Tracing)技术,这种技术在理论上比较容易,但在实际中很难实现,尤其是对于复杂的彩色图像。
7.3.2 图像数字化过程
要在计算机中处理图像,必须先把真实的图像(照片、画报、图书、图纸等)通过数字化转变成计算机能够处理的显示和存储格式,再用计算机进行分析处理。 图像的数字化过程主要分为采样、量化和压缩编码三个步骤。
1.采样
采样的实质就是要用多少个点来描述一幅图像,采样结果质量的高低用图像分辨率来衡量。 采样频率指一秒内采样的次数,它反映了采样点之间的间隔大小。 采样频率越高,得到的图像样本越逼真,图像的质量越高,但要求的存储量也就越大。 在进行采样时,采样点间隔大小的选取很重要,它决定了采样后的图像能真实地反映原图像的程度。 一般来说,原图像中的画面越复杂,色彩越丰富,采样间隔就应该越小。 由于二维图像的采样是一维的推广,根据信号的采样定理,要从取样样本中精确地复原图像,可得到图像采样的奈奎斯特定理:图像采样的频率必须大于或等于源图像最高频率分量的两倍。
2.量化
量化是指要使用多大范围的数值来表示图像采样之后的每一个点。 量化的结果是图像能够容纳的颜色总数,它反映了采样的质量。
在量化时所确定的离散取值个数称为量化级数。 为表示量化后各像素的色彩值所需的二进制位数称为量化位数(或颜色深度),一般用8位、16位、24位和32位来表示图像的颜色,它决定了彩色图像中可出现的最多颜色数,或灰度图像中的最大灰度等级数。 量化位数越多,图像色彩越丰富,图像也就越逼真,如图7-15所示。
图7-15 不同量化位数下的图片效果
经过采样和量化得到的一幅空间上表现为离散分布的有限个像素点,在量化时所确定的离散取值个数称为量化级数。 为表示量化的色彩值(或亮度值)所需的二进制位数称为量化字长,一般可用8位、16位、24位或更大的量化字长来表示图像的颜色;量化字长越大,越能真实地反映出版原有的图像的颜色,但得到的数字图像的容量也越大。
数字化图像以磁盘文件形式保存,称为图像文件。 图像文件的大小与图像的分辨率和图像颜色深度有关。 图像分辨率越高,图像颜色深度越大,则图像的质量越好,图像的存储容量也就越大。 一幅未经压缩的图像文件的存储容量可以按照下面的公式进行估算。
图像存储容量(B)=图像水平方向的像素数×垂直方向的像素数×颜色深度/8
例如,一幅分辨率为256×512的16位色静态图像,其占用的存储容量为
256×512×16/8=256(KB)
由此可见,数字化得到的图像数据量十分巨大,必须进行压缩,以减少图像的数据量。
3.压缩编码
数字化后得到的图像的数据量十分巨大,必须采用编码技术来压缩其信息量。 从一定意义上讲,编码压缩技术是实现图像传输与存储的关键。
目前,已有许多成熟的编码算法应用于图像压缩。 常见的有图像的预测编码、变换编码、分形编码、小波变换图像压缩编码等。
当需要对所传输或存储的图像信息进行高比率压缩时,必须采取复杂的图像编码技术。 但是,如果没有一个共同的标准做基础,不同系统间不能兼容,除非每一个编码方法的各个细节完全相同,否则各系统间的连接会十分困难。
为了使图像压缩标准化,20世纪90年代后,国际电信联盟(ITU)、国际标准化组织(ISO)和国际电工委员会(IEC)近年来已经制定并继续制定了一系列静止和活动图像编码的国际标准,现已批准的标准主要有JPEG标准、MPEG标准、H.261等。 这些标准和建议是在相应领域工作的各国专家合作研究的成果和经验的总结,这些国际标准的出现也使图像编码,尤其是视频图像编码压缩技术得到了飞速发展。 目前,按照这些标准做的硬件、软件产品和专用集成电路已经在市场上大量涌现(如图像扫描仪、数码照相机、数码摄像机等),这对现代图像通信的迅速发展和开拓图像编码新的应用领域发挥了重要作用。
7.3.3 数字图像文件格式
在多媒体计算机中,可通过扫描仪、数字化仪或光盘上的图像文件等多种方式获取图像,每种获取方法又是由不同的软件开发商研制开发的,因而就出现了多种不同格式的图像文件。 常见的图形图像文件格式有以下14种。
1.GIF格式
GIF(Graphics Interchange Format)是美国CompuServe公司制定的格式,分为静态GIF和动态GIF两种,支持透明背景图像,适用于多种操作系统,“体型”很小,适合在Web中使用,是Internet中的重要文件格式之一,支持64000像素的图像。
2.BMP格式
BMP(Bitmap)是一种与设备无关的图像文件格式,它是和Windows操作系统绑定在一起的一种位图图像格式,Windows软件的画图程序生成的图像信息默认以该格式存储。 其最大优点是能被大多数软件“接受”,所以又称为“通用格式”。 其文件分为三部分:文件头、信息头和图像数据。 文件头用来说明文件类型、实际图像数据长度和起始位置、分辨率等,信息头是彩色映射。
3.PCX格式
PCX格式是ZSoft公司在开发图像处理软件PaintBrush时开发的一种格式,是基于PC的绘图程序的专用格式,一般的桌面排版、图形艺术和视频捕获软件都支持这种格式。 PCX支持256色调色板或全24位的RGB图像,图像像素最多可达64k×64k。 PCX格式的文件不支持CMYK或HSI颜色模式,Photoshop等多种图像处理软件均支持PCX格式。 PCX压缩属于无损压缩。
4.TIFF格式
TIFF(Tagged Image File Format)是由原Aldus和微软公司合作开发的用于扫描仪和桌面版系统的文件格式,称为标记图像文件格式。 其有压缩和不压缩两种格式,以其灵活而获得用户的青睐,多数应用程序支持这种格式。
5.JPEG格式
JPEG(Joint Photographic Expert Group)是由静态图像专家组制定的图像标准,其目的是解决专业摄影人员对高质量图片的存放问题。 JPEG文件的扩展名为.jpg,其最大特点是采用JPEG方法压缩而成,压缩比高,并可在压缩比和图像质量之间达到平衡,用最经济的存储空间得到较好的图像质量。 其文件非常小,而且可以调整压缩比,用JPEG格式存储的文件大小是其他格式的1/20~1/10,一般而言,文件只有几十千字节或一二百千字节,而色彩数可达到24位,图像质量与照片没有太大差别,所以它被广泛运用于Web上。
6.AI
AI是Adobe公司的图形处理软件Illustrator的专用格式。 其优点是占用硬盘空间小,打开速度快,格式转换方便。
7.CDR
CDR是Corel公司的图形处理软件CorelDRAW的专用格式。 由于CorelDRAW是矢量图形绘制软件,因此CDR可以记录文件的属性、位置和分页等。 它在兼容性上比较差,在所有Corel DRAW应用程序中均能够使用,但其他图像编辑软件打不开此类文件。 Corel DRAW主要有两方面的功能,即绘图与排版。
8.WMF
WMF是一种矢量图形格式,Word中内部存储的图片或回执的图形对象属于WMF格式。 无论是放大还是缩小,图形的清晰度不变,WMF是一种清晰简洁的文件格式。它是微软公司定义的一种Windows平台下的图形文件格式。 WMF格式的文件所占的磁盘空间比其他格式的图形文件小得多。
9.DWG
DWG是Autodesk公司制定的格式,主要应用于计算机辅助设计Autodesk等软件中。 Illustrator软件中强大的绘图工具可以与Auto CAD配合使用,Illustrator中导出的DWG格式的文件可以直接导入Auto CAD中使用,扩展名是.dwg,是二维或三维图形档案,它还可以和多种文件格式进行转换,如DXF、DWF等。
10.DXF
DXF(Drawing eXchange Format)格式的文件的扩展名是.dxf,是Auto CAD中的图形文件格式,它以ASCII方式存储图形,在表现图形的大小方面十分精确,可被Corel-DRAW和3DS Max等大型软件调用编辑。
11.SWF
SWF(Shock Wave Flash)是Adobe公司的动画设计软件Flash的专用格式,是一种支持矢量和点阵图像的动画文件格式,被广泛应用于网页设计、动画制作等领域,SWF文件通常也被称为Flash文件。 SWF普及程度很高,现在超过百分之九十九的网络使用者都可以读取SWF档案。 这个格式的FutureWave创建,后来为了创作小档案以播放动画收到了Macromedia公司的支援,计划是可以在任何操作系统和浏览器中进行操作,并让网络较慢的用户也能顺利浏览。 SWF可以用Adobe Flash Player打开,浏览器必须安装Adobe Flash Player插件
12.PDF
该格式是由Adobe公司推出的专门为线上出版而定制的,它以Post Script Level 2为基础,可以覆盖矢量图片和点阵图,并且支持超链接。 该格式可以保存多页信息,其中包含图片和文本。 此外,由于该格式支持超链接,因此是网络下载时经常使用的文件格式,PDF格式支持RGB颜色模式、索引颜色、CMYK颜色模式、灰度、位图和Lab颜色模式,但是不支持Alpha通道。
13.EPS
EPS是跨平台的标准格式,是专用的打印机描述语言,可以描述矢量信息和位图信息,主要用于矢量图形和栅格图像的存储。 这是一个压缩的PostScript格式,是为在PostScript打印机上输出图像开发的。 在PostScript图形打印机上能打印出高品质的图形图像,最高能表示32位图形图像。 EPS格式包含两部分:第一部分是屏幕显示的低解析度影像,方便影像处理时的预览和定位;第二部分包含各个分色的单独资料。 EPS文件以DCS/CMYK形式存储,文件中包含CMYK四种颜色的单独资料,可以直接输出四色网片。 其最大优点是可以在排版软件中以低分辨率预览,而在打印时以高分辨率输出。 EPS格式的缺点如下:首先,EPS格式存储图像效率特别低;其次,该格式的压缩方案比较差,一般同样的图像经EPS压缩后是经TIFF的LZW压缩的图像的3~4倍。
14.SVG
SVG文件格式是一种可缩放的矢量图形格式。 它是一种开放标准的矢量图形语言,可任意放大图形显示,边缘异常清晰,文字在SVG图像中保留可以编辑和可以搜寻的状态,没有字体的限制,生成的文件很小,下载很快,十分适用于高分辨率的Web图形页面。
7.3.4 图像技术基础
1.色彩基础
在太阳光线的照射下,人们会看到万紫千红的景象,以及一幅幅美丽的画卷。 在不同的光线照射下,同一种景物具有各种不同的颜色,这是由于物体的表面具有不同的吸收光线与反射光线的能力,反射光不同,眼睛就会看到不同的色彩,因此色彩的发生是光对人的视觉和大脑发生作用的结果,是一种视知觉。 由此看来,需要经过光-眼-神经的过程才能见到色彩。 色彩是光的产物,没有光便没有色彩感觉,色彩的形成和光有密切的关系:光是色之母,色是光之子,无光就是无色。
(1)光
光进入视觉一般有以下三种形式。
光源光:光源发出的色光直接进入视觉,如霓虹灯、饰灯、烛灯等的光线都可以直接进入视觉。
透视光:光源光穿过透明或半透明物体后再进入视觉的光线称为透射光,透射光的光度和颜色取决于入射光穿过透射物体之后所达到的光透射率及波长特征。
反射光:反射光是光进入眼睛的最普遍的形式,在有光线照射的情况下,眼睛能看到的任何物体都是该物体的反射光进入视觉所致的。
(2)三原色
三原色通常分为两类:一类是色光三原色,另一类是颜料三原色。 但在美术上又把红、黄、蓝定义为色彩三原色。 品红加少量黄可以调出大红(红=M100+Y100),而大红却无法调出品红;青加少量品红可以得到蓝(蓝=C100+M100),而蓝加绿得到的却是不鲜艳的青;用黄、品红、青三色能调配出更多的颜色,而且颜色纯正、鲜艳。 用青加黄调出的绿(绿=Y100+C100),比蓝加黄调出的绿更加纯正、鲜艳;品红加青调出的紫是很纯正的(紫=C20+M80),而大红加蓝只能得到灰紫等。 此外,从调配其他颜色的情况来看,都是以黄、品红、青为其原色,这样的色彩更为丰富、色光更为纯正和鲜艳。
综上所述,无论是从原色的定义出发,还是以实际应用的结果验证,都足以说明,把黄(柠檬黄)、品红、青(湖蓝)称为三原色,较红、绿、蓝的三原色更为恰当。
①间色:指两个不同的原色相混合所产生的另一种色,故称为第二色,也称为同色。间色是指橙、绿、紫。
②固有色:从视觉感觉的概念出发,人们习惯于把白色阳光下的物体呈现的色彩效果称为“固有色”。 例如,绿色的草原、金黄色的麦浪、红色的旗帜等。
③环境色:指一个物体的周围物体所反射的光色,它体现在距离较近的物与物之间或某个大范围内所形成的某种色彩环境。
(3)色彩三要素
视觉所感知的一切色彩形象,都具有明度、色相和纯度三种性质,这三种性质是色彩最基本的构成元素。
①明度(Value,V):色彩的明暗强度就是所谓的明度,明度高指色彩较明亮,而相对明度低就是色彩较灰暗。
计算明度的基准是灰度测试卡。 黑色为0,白色为10,在0~10中等间距地排列9个阶段。
②色相,即色名(Hue,H),是区分色彩的名称,也就是色彩的名称。
③色彩是由于物体上的物理性的光反射到人眼视神经所产生的感觉。 色的不同是由光的波长的长短差别所决定的。 作为色相,指的是这些不同波长的色的情况。 波长最长的是红色,最短的是紫色。 把红、橙、黄、绿,蓝、紫和处于它们之间的红橙、黄橙、黄绿、蓝绿、蓝紫、红紫共计12种色作为色相环。 在色相环上排列的色是纯度高的色,被纯为纯色。 这些色在环上的位置是根据视觉和感觉的相等间隔进行安排的。 在色相环上,与环中心对称,并在180°的位置两端的色被称为互补色。
④纯度,也称为彩度(Chroma,C),用数值表示色的鲜艳或鲜明的程度。 有彩色的各种色都具有彩度值,无彩色的颜色的彩度值为0。 对于有彩色的色的彩度(纯度)的高低,应根据这种色中含灰色的程度来计算。 彩度由于色相的不同而不同,即便是相同的色相,因为明度的不同,彩度也会随之变化。
2.色彩模式
计算机是通过数字化的方式定义颜色特性的,通过不同的色彩模式显示图像,比较常用的色彩模式有:RGB模式(R表示红色,G表示绿色,B表示蓝色)、CMYK模式(C表示青色,M表示品红色,Y表示黄色,K表示黑色)、Lab模式、灰度模式、Bitmap(位图)模式。
(1)RGB模式
RGB模式基于自然界中三种基色光的混合原理,将红、绿、蓝三种基色按照0(黑色)~255(白色)的亮度值在每个色阶中进行分配,从而指定色彩。 当不同亮度的基色混合后,便会产生256×256×256种颜色,约为1670万种。 例如,一种明亮的红色,其各项数值可能是R=246、G=20、B=50。 当三种基色的亮度值相等时,会产生灰色;当三种亮度值都是255时,会产生纯白色;当三种基色亮度值都为0时,会产生纯黑色。 三种光色混合生成的颜色一般比原来的颜色亮度高,所以RGB模式又被称为色光加色法。
(2)CMYK模式
CMYK模式是一种印刷模式,其中四个字母分别是青、品红、黄、黑,在印刷中代表四种颜色的油墨。 CMYK模式和RGB模式是使用不同的色彩原理进行定义的。 RGB模式中由光源发出的色光混合生成颜色,而CMYK模式中由光线照到不同比例的青、品红、黄、黑油墨的纸上,部分光谱被吸收后,反射到人眼中的光又产生了颜色。 当青、品红、黄、黑在混合成色时,随着青、品红、黄、黑四种成分的增多,反射到人眼中的光会越来越少,光线的亮度会越来越低,所以CMYK模式产生颜色的方法又被称为色光减色法。
(3)Lab模式
Lab模式的原型是由CIE协会制定的一个衡量颜色的标准,此模式解决了由于使用不同的显示器或打印设备所造成的颜色复制差异,因此该模式不依赖于设备。
Lab模式由三个通道组成,但不是R、G、B通道。 其中,L表示亮度,取值为0~100, a分量表示由绿色到红色的光谱变化,b分量表示由蓝色到黄色的光谱变化,a和b的取值是-120~120。 a通道包括的颜色从深绿色(低亮度值)到灰色(中亮度值)再到亮粉红色(高亮度值);b通道则从亮蓝色(低亮度值)到灰色(中亮度值)再到黄色(高亮度值)。 因此,这种色彩混合后将产生明亮的色彩。
Lab模式所包含的颜色范围最广,而且包含所有RGB和CMYK中的颜色。 CMYK模式所包括的色彩最少,有些在屏幕上看到的颜色在印刷品上却无法实现。
7.3.5 图像的获取方法
计算机获取图像的方法有以下几种。
1.用图形图像处理软件制作
用户可利用PaintBrush、Photoshop、CorelDraw等图形图像软件创作所需要的图片,这些软件都具有大致相同的功能,能用鼠标(或数字化仪)描述各种形状的图形,并可进行填色、填图案、变形、剪切、粘贴等操作,也可标注各种文字符号,使用这种方法可以很方便地生成一些小型得、简单的画面,如图案、标志等。 利用这些软件进行设计和修改都很方便,成本较低。
2.用工具软件获取图像
获取图像的工具软件很多,如Snag It。 Snag It是一款非常著名的优秀的屏幕、文本和视频捕获、编辑与转换软件。 使用Snag It,可以捕获Windows屏幕、DOS屏幕;RM电影、游戏画面;菜单、窗口,客户区窗口,或用鼠标定义的区域。 捕获的视频只能保存为AV格式,文本只能够在一定的区域内进行捕捉,图像可保存为BMP、PCX、TIFF、GIF、PNG或JPEG格式,使用JPEG可以指定所需的压缩级(1%~99%)。 可以选择是否包括光标或添加水印。 另外,Snag It还具有自动缩放、颜色减少、单色转换、抖动,以及转换为灰度级等功能。
3.图像扫描
图像扫描仪主要应用在图纸之类的平面图像采集的场合,根据其外形和产生图像的方式通常将其分为手持式、平板式和滚筒式三种类型,根据其对颜色的辨别能力又分为单色、灰度和彩色三种类型。
滚筒式扫描仪多用于输入较大尺寸的图像。 平板式扫描仪带有感应窗的自动移动装置,只需将扫描仪对象平放在扫描面板上即可,是投资较低并能获得较高质量图像的较理想的选择。 手持式扫描仪造价低廉,可直接对书本杂志上的图片进行扫描,而不必将图片剪裁下来,因而在MPC中使用较多。
4.数字摄像输入
利用电视摄像机或数字式照相机,可把照片、艺术作品甚至实际场景输入到计算机中而产生一幅幅数字图像。 这种方式与普通相机、录像机相比,省去了胶片及冲洗过程,可以直接将采集的数字图像信息保存在内部存储器中。
摄像机与扫描仪的差别如下:扫描仪只能输入平面的图像,而摄像机可以捕获三维空间的景物,即使是输入平面的图像,速度也比扫描仪快。 扫描仪只能输入静止的图像,而摄像机既可以输入静止图像,又可以输入活动图像。
5.视频抓帧
先打开“超级解霸”播放器,播放VCD;当播放到某一精彩画面时,立即按下暂停键,让画面静止;再单击照相机外形的按钮,弹出一个对话框,提示将此时的画面存盘;最后在对话框中输入存储文件名及存盘路径,单击OK按钮即可将这一精彩镜头抓取并存盘,此图像文件以后可以随时调用。
6.从图片库中获取
现有的图片大多以光盘形式保存,其中收集了世界上各地著名摄影师所拍摄的各类图片,包括自然风光、花鸟鱼虫、风土人情、城市景观、边框水纹、装饰按钮等,可以根据不同的场合选择使用。
7.从网络上下载
现在因特网已经普及,网络图像资源十分丰富,各种类型的图像可以通过网络获取。
除了以上获取图片的方法之外,还可以使用键盘上的PrintScreen键获取显示器上的静止图像;通过使用Alt+PrintScreen键截取获取当前活动窗口。 获取后的图像存放在系统的剪贴板中,通过在应用程序中粘贴,可将获取的内容展现在程序文件中。