2.6 空间数据的处理
2.6.1 空间数据的裁切
数据裁切是从原始数据中裁切出用户感兴趣区域(Area of interest,AOI)的部分,从而获取用户真正需要的研究区域内的数据,以减少不必要的数据参与运算,降低对存储空间和处理时间的开销。
ArcGIS中对矢量数据进行裁切的Clip工具(ArcToolbox>AnalysisTools>Extract>Clip)。
ArcGIS中对栅格数据进行裁切的Extract by Mask等工具(ArcToolbox>Spatial Analysis Tools>Extraction>Extract by Mask)。
2.6.2 空间数据的拼接
数据拼接是指将多个空间相邻的数据拼接成为一个完整的目标数据。
在进行空间数据的拼接时,还必须进行边缘匹配处理。
矢量数据拼接一般需要以下几个过程:
1.数据准备:将待拼接的两个或多个数据进行几何纠正或投影变换等空间坐标调整,使其具有正确的空间坐标。若有必要,还需进行投影定义。
2.数据合并:将相邻的数据合并成一个数据。
3.边缘匹配:首先,对接合处邻接点的空间坐标进行调整(一般需要进行端点捕捉)。当邻接的同名点位置差异较小时,可以以一侧的邻接点为基准,调整另一侧邻接点的坐标;若位置差异较大,则将两侧的点都往其中间位置上进行调整。必要时还需要对邻接点两侧一定范围的坐标作适当调整,以使相连的线能够过渡自然。然后,对接合处同一要素的属性进行检查,确保其逻辑一致性。最后,对相邻的要素进行合并,使其成为一个整体。具有相同属性的邻接多边形在合并后将删除公共边界。
栅格数据的拼接与矢量拼接的过程基本一致,不同的是在接边或重叠部分的处理上有一定差异,它往往采用某些图像处理工具或根据一定的算法(如重叠部分求均值),使接边过渡自然。
ArcGIS中用于矢量数据拼接的Append工具(ArcToolbox>DataManagement Tools>General>Append)
ArcGIS中用于栅格数据拼接的MosaicTo New Raster工具(ArcToolbox>Data Management Tools>Raster>Raster Dataset>Mosaic to New Raster)
2.6.3 空间数据的提取
数据提取是根据一定的属性条件,从已有的数据中选取部分要素,输出为一个新的数据。它相当于在原数据中提取出符合某些条件的子集。
空间数据裁切是获取特定空间范围内的子集
空间数据提取是获取满足一定属性要求的子集
ArcGIS中对矢量数据进行提取的Select工具(ArcToolbox>AnalysisTools>Extract>Select)
ArcGIS中对栅格数据进行提取的Extract by Attributes 工具(ArcToolbox>Spatial Analysis Tools>Extraction>Extract by Attributes)。
2.6.4 空间数据的概括
数据概括(Generalization)也称数据综合,它是根据一定的规则对要素进行概括或取舍,保留数据的宏观特征。常见的概括方法有数据平滑、简化、融合、特征集结等。
对数据概括的目的:
1.尺度变化
2.细碎要素的处理
3.图像处理
以下结合ArcGIS,分别介绍几种对矢量数据和栅格数据进行数据概括的工具。
1.融合(Dissolve):该工具用于矢量数据,根据要素的某项属性,将属性值相同的要素聚合为同一要素。对属性值相同,且空间上相邻(具有公共边)的多边形来说,融合后将生成一个多边形,原有的公共边将被删除。
ArcGIS中用于矢量数据融合的工具——Dissolve(ArcToolbox>DataManagement Tools> Generalization >Dissolve)。
2.消除(Eliminate):该工具也是用于矢量数据,可以将碎多边形合并到相邻的多边形中,从而消除碎多边形。
ArcGIS中用于消除要素的工具——Eliminate(ArcToolbox>DataManagement Tools> Generalization> Eliminate)。
3.聚合(Aggregate):聚合的本质是对栅格数据进行重采样。它在原栅格数据的基础上生成一个更低分辨率(像元更大)的栅格数据。新栅格中每个像元的值是将该范围内原有栅格的值,通过一定的聚合方式(如Sum、Max、Min、Mean、Median)而产生的。
ArcGIS中用于聚合的工具——Aggregate(ArcToolbox>SpatialAnalyst Tools> Generalization> Aggregate)。
4.其他栅格数据综合的工具
在ArcGIS的空间分析工具集中,关于栅格数据综合的工具还有以下几个(ArcToolbox>Spatial Analyst Tools> Generalization>……)。
(1)扩展(Expand):扩展是指将栅格中某一类型的区域向外按指定的像元数目(宽度)进行延展,延展区内的像元取该类型区的值。该工具将使得指定类型的要素得到突出显示(或作为前景)。
(2)收缩(Shrink):收缩与扩展相反,它是按指定像元数目收缩所选择的区域,方法是用邻域中出现最频繁的像元值替换该区域的值。
(3)蚕食(Nibble):用最邻近点的值替换掩膜范围内的栅格像元的值。该算法将确定掩膜栅格中具有NoData 值的所有区域,输入栅格中的对应区域将被一点点地除去。然后执行内部欧氏分配,从而根据欧氏距离对各个被掩膜的像元进行最近邻域值的分配。
(4)细化(Thin):它通过减少表示要素宽度的像元数来对栅格化的线状对象进行细化。
(5)区域合并(RegionGroup):它是用于记录输出栅格中每个像元所属的连接区域的标识,每个区域都将被分配给唯一编号。
(6)众数滤波(MajorityFilter):它根据相邻像元数据值的众数替换栅格中的像元。可以认为是“少数服从多数”,太突兀的像元会被周围的大部队“干掉”。
(7)边界清理(BoundaryClean):它是通过扩展和收缩,在一个较大的尺度上清除区域之间的锯齿状边界,达到平滑区域间边界的目的。