在对图像的研究和应用中,人们往往仅对图像中的某些目标感兴趣,这些目标通常对应图像中具有特定性质的区域。图像分割(ImageSegmentation)是指把一幅图像分成不同的具有特定性质区域的图像处理技术,将这些区域分离提取出来以便进一步提取特征,是由图像处理到图像分析的关键步骤。图像分割由于其重要性一直是图像处理领域的研究重点。
图像分割后的区域应具有以下特点:
(1) 分割出来的区域在某些特征方面(如灰度、颜色、纹理等)具有一致性;
(2)区域内部单一,没有过多小孔;
(3)相邻区域对分割所依据的特征有明显的差别;
(4)分割边界明确。
同时满足所有这些要求是有困难的,如严格一致的区域中会有很多孔,边界也不光滑;人类视觉感觉均匀的区域,在分割所获得的低层特征上未必均匀;许多分割任务要求分割出的区域是具体的目标,如交通图像中分割出车辆,而这些目标在低层特征上往往也是多变的。图像千差万别,还没有一种通用的方法能够兼顾这些要求,因此,实际的图像分割系统往往是针对具体应用的。
目前已有形形色色的分割算法。本章讲解常用的图像分割技术,包括阈值分割方法、边界分割方法、区域分割方法、聚类分割、分水岭分割等。
课程思政:在刑事侦查工作中,从作案现场的图像可以通过相应的技术手段去寻找线索,只要有任何的蛛丝马迹,即可追本溯源。我们要敬畏规则,尊重生命。
1.阈值分割
阈值分割是根据图像灰度值的分布特性确定某个阈值来进行图像分割的一类方法。
由以上描述可知,阈值的选取直接决定了分割效果的好坏,所以阈值分割方法的重点在于阈值的选择。下面讲解常用的阈值选择方法。
(1)基于灰度直方图的阈值选择
若图像的灰度直方图为双峰分布,如图10-1(a)所示,表明图像的内容大致为两个部分,其灰度分别为灰度分布的两个山峰附近对应的值。选择阈值为两峰间的谷底点对应的灰度值,把图像分割成两部分。这种方法可以保证错分概率最小。
同理,若直方图呈现多峰分布,可以选择多个阈值,把图像分成不同的区域。如图10-1(b)所示,选择两个波谷对应灰度作为阈值,可以把原图分成3个区域或分为两个区域,灰度值介于小阈值和大阈值之间的像素作为一类,其余的作为另外一类。
(2)基于模式分类思路的阈值选择
这类方法采用模式分类的思路,认为像素值(通常是灰度,也可以是计算出来的像素梯度、纹理等特征值)为待分类的数据,寻找合适的阈值,把数据分为不同类别,从而实现图像分割。
模式分类的一般要求为:类内数据尽量密集,类间尽量分离。按照这个思路,把所有的像素分为两组(类),属于“同一类别”的对象具有较大的一致性,“不同类别”的对象具有较大的差异性。方法的关键在于如何衡量同类的一致性和类间的差异性,采用不同的衡量方法对应不同的算法,例如可采用类内和类间方差来衡量,使类内方差最小或使类间方差最大的值为最佳阈值。经典分割算法—OTSU算法即是最大类间方差法。
1)最大类间方差法
2)最大熵法
熵是信息论中对不确定性的度量,是对数据中所包含信息量大小的度量,熵取最大值时,表明获取的信息量最大。
进行图像阈值分割,将图像分为两类,可以考虑用熵作为分类的标准:若两类的平均熵之和为最大时,可以从图像中获得最大信息量,此时分类采用的阈值是最佳阈值。
最小误差法需要已知目标在图像中所占的比例,并要求目标和背景的灰度概率密度符合正态分布,因此,往往需要用已知的正态分布来拟合直方图的分布,实现较为复杂。
2.其他阈值分割方法
本小节学习基于迭代运算的阈值选择和基于模糊理论的阈值选择方法。
(1)基于迭代运算的阈值选择
基于迭代运算选择阈值的基本思想是先选择一个阈值作为初始值,然后进行选代运算,按照某种策略不断改进阈值,直到满足给定的准则为止。这种分割方法的关键在于阈值改进策略的选择——应能使算法快速收敛且每次迭代产生的新阈值优于上一次的阈值。
一种常用的基于迭代运算的阈值分割算法如下:
当隶属度为0或1时,模糊度最小,Shannon函数取值为0;当隶属度为0.5时,模糊度最大,Shannon函数取最大值ln2;因此,模糊熵取最小值时对应的阈值为最佳阈值。

