1
模式识别与智能计算的MATLAB实现
1.16.1.2 14.1.2 特征的类别
14.1.2 特征的类别

特征是用于描述模式性质的一种量,从形式上看可以分为以下几类:

(1)物理特征

人的胖瘦、身高、性别等物理特征是比较直接、人们容易感知的特征,一般在设计模式识别系统时容易被选用;但对于较为复杂的对象,物理特征却未必能非常有效地表征分类对象的特点。

(2)结构特征

结构特征的表达是先将研究对象分割成若干个基本构成要素,再确定基本要素间的相互连接关系。结构特征比物理特征要抽象些,表达能力一般也要高于物理特征。通过要素和相互连接关系表达对象,可以较好地表达复杂的图像图形信息,实际上已经有较多的成功应用,如指纹、手写体的识别等都是基于结构信息完成的。

(3)数字特征

一般来说,数字特征是为了表征研究对象而设立的特征,具有较强的抽象性,不容易被人感知。数字特征有时和研究对象的固有特性没有任何关系,有时则是物理或结构特征的计算结果。

在实际工作中,可以提取一种特征,也可提取多种特征并相互结合;但应遵循一个原则,即选择的特征应能获得良好的分类结果。如在化学研究的模式识别中,用作特征的是各种化学量测数据,通常是依据化学量测的实际和经验来选取特征。化学中所用特征大体上可分为六类:

·分子拓扑特征。此类特征由分子二维连接表派生出来,如原子及键的属性、原子的连接度以及各种拓扑指数等。

·分子几何特征。此类特征由分子的三维模型派生出来,其中包括惯性动量、分子体积、分子表面积等。

·原子的电子特征,如原子电荷、原子的半径、原子实半径、分子的空轨道、原子的总能等。

·化合物的物理化学参数,如化合物的辛醇—水分配系数、熔点、沸点、相潜热等。

·化合物的谱图特征,如化合物的红外光谱图中的波数、1H-NMR中的化学位移、色谱的保留值等。

·化合物的化学组成,如某类物质的无机化学组成及有机化学组成等。

(4)图像特征

图像特征是指图像的原始特性或属性。其中,有些是视觉直接感受到的自然特征,如区域的亮度、边缘的轮廓等;有些是需要通过变换或测量才能得到的人为特征,如变换频谱、直方图等。常用的特征可以分为灰度特征、纹理特征和几何形状特征等。其中,灰度特征和纹理特征属于内部特征,需要借助于分割图像从原始图像上测量;几何形状特征属于外部特征,可以从分割图像上测量。

①一阶灰度统计的特征提取

最常用来描述图像灰度分布情况的是一阶灰度直方图,它实际上是图像灰值的一阶概率分布。

在MATLAB中,可以用imhist函数创建图像直方图,用来显示索引图像或灰度图像的亮度分布,并可以求得直方图均值、直方图方差等。

还可以用mean2(BW)函数计算图像BW矩阵中元素的均值,std2计算矩阵中元素的标准差,corr2计算两个相同矩阵的相关系数。而图像区域的属性可以用regionprop(L,‘属性’)函数计算,其中L为图像的标签,可以用命令:L=bwlabel(BW)获得,‘属性’为要计算的属性字符串,如area(面积)、centroid(质心)和BoundingBox(包围盒)等,更多内容可参见此函数的在线帮助。

在最新的MATLABR14中提供了一个灰度共生矩阵的计算函数graycomtrix,利用它可以计算灰度共生矩阵,反映出图像灰度关于方向、相邻间隔、变化幅度的综合信息。若配合graycoprops函数,则还可以计算灰度共生矩阵的一些统计特征值,包括对比度、相关、能量和同质性等。

②纹理特征的提取

图像局部地域的纹理特征是识别客体的主要依据之一。例如遥感图像中的物质与地貌的区别,往往并不在于灰值的大小,而在于它们的纹理特性。

纹理是像素灰度级变化具有的空间规律性的视觉表现,即有纹理的区域像素灰度级分布具有一定的形式。通过研究图像中像素的灰度级分布,可建立直方图与纹理基元之间的对应关系,如灰度级的直方图特征、边缘方向直方图特征等。纹理分析是指用图像的纹理内容来描述图像上的区域,它可用于遥感、自动化检测和医学图像处理等方面。在MATLAB的图像工具箱中有3个纹理分析函数,它们用极差、标准差和熵等对图像进行滤波。

b=rangefilt(bw):  计算图像bw的局部极差。

b=stdfilt(bw):   计算图像bw的局部标准差。

b=entropyfilt(bw): 计算图像bw的局部熵。

③矩特征

对于计算机图像识别系统而言,物体的形状是识别的重要特征。一个图像的形状和结构特征有两种形式:一种是数字特征,主要包括几何属性(如长短、面积、距离和凹凸特性等)、统计属性和拓扑属性(如连通、欧拉数);另一种是由字符串和图来表示的特征。

对于灰度图像的形状和结构,一般可用区域和目标边界来描述其特征,其中不变矩特征是一个常用的特征指标,它可用于图像的匹配及模式识别。

p+q阶矩的定义为

alt

其中,(x,y)为图像位置坐标,f(x,y)为图像灰度。当图像发生平移变化时,mpq也将发生改变,为了使mpq具有平移不变性,定义p+q中心矩为

alt

其中

alt

alt

为物质质量中心的坐标,也表示区域灰度重心的坐标。

f(x,y)归一化为

alt

其中,alt,p+q≥2。

图像的各阶不变矩定义为

alt

例14.1 分别计算图14.1所示的两幅图像的不变矩。

alt

图14.1 树的灰度图像

:根据不变矩的定义,可求出两幅图像的不变矩如表14.1所列。

alt

表14.1 不同图像的7个不变矩值

alt

从表中可看出,两幅图像的7个不变矩的数值基本相同,完全可以用作图像的特征指标。但不变矩是指在平移、旋转和比例变换下的不变量,对于其他类别的变换如仿射变换、射影变换,上述的7个矩不变量是不成立的,只能作为近似的不变量。

④几何特征

在工件识别和其他相类似模式识别的情况下,几何特征往往是非常重要的,它描述目标区域的几何性质,与区域的灰值大小无关。因此,这类特征常在二值化的图像区域上度量,有的则仅与目标区域的边界有关。

二值图像操作只返回与二值图像的形式或结构相关的信息,如果希望对其他类型的图像进行同样的操作,则要用im2bw函数将其转换成二值图像。

二值图像bw的面积可以用bwarea函数计算,而二值图像的欧拉数则用bweuler计算,它等于图像中所有对象的总数减去这些对象中孔洞的数目。

函数bwdist可以计算两个像素或区域之间的各种距离,包括欧氏距离(euclidean)、准欧氏距离(quasi-euclidean)、棋盘距离(chessboard)、城区距离(cityblock)等。

函数bwboundaries可以对二值图像进行边界跟踪检测,并结合regionprops函数实现对简单几何图形(圆形、正方形、矩形等)的识别。

在二值图像中,所谓的对象,是值为1的像素按照一定规则连接在一起的集合,值为0的像素代表的是背景。像素的连接类型定义该像素是与哪些像素相连接的,即像素的邻域是由哪些像素组成的,邻域的类型将影响图像中所能找到的对象数目和对象边界,在MATLAB中的二值图像连接类型主要是4连接和8连接。

函数bwlabel可以进行连接组分的标注,标注以后,就可以识别二值图像中的每一个对象矩阵中1组成的区域表示第1个对象,2表示第2个对象,以此类推。