2.4.1 空间数据质量的概念和内容
1. 与空间数据质量相关的几个概念
1)误差(Error):指测量值(或结果、计算值)与真实值之间的差异。
2)数据的准确性(Accuracy):指测量值(或结果、计算值)与真实值之间的接近程度。
3)数据的精密度(Precision):表示数据的精密程度,体现测量值本身的离散程度。它常用表示数据的有效位数来衡量。通常把精密度与准确性结合在一起称为精确度,简称精度。
4)分辨率(Resolution):分辨率是指可测量对象能被人所认知的最小单位。空间分辨率可以看作记录变化的最小距离。对于遥感图像,其空间分辨率主要取决于传感器的性能和成像高度。
5)不确定性(Uncertainty):它是关于空间事物、现象的特征和过程不能被准确确定的程度。不确定性是自然界各种空间现象自身的固有属性,在内容上,它是一个以真值为中心的范围。
6)比例尺(Scale):它是地图上一段距离和它所表现的“真实世界”距离之间的一个比例。地图的比例尺将决定地图上一条线段的长度所表现的地面距离。
2. 空间数据质量指标和内容
从实用的角度来看,反映空间数据质量标准的指标主要包括以下几项:
1)数据情况说明(Source):要求对空间数据的来源、内容及其处理过程等做出准确、全面和详尽的说明。
2)位置精度(定位精度)(Metric accuracy):指空间实体的坐标数据与实体真实位置的接近程度,常表现为空间三维坐标数据精度。它包括数学基础精度、平面精度、高程精度、接边精度、形状再现精度(形状保真度)、像元定位精度(图像分辨率)等。3)属性精度(Attribute accuracy):指空间实体的属性值与其真实值相符合的程度。它通常取决于地理数据的类型且常常与位置精度有关,包括要素分类与代码的正确性、要素属性值的准确性及其名称的正确性等。
4)时间精度(Temporal accuracy):包括两个方面,一是指空间数据更新的时间距当前的远近(即现势性),二是指空间数据更新的频率。
5)逻辑一致性(Logical consistency):指空间数据关系上的可靠性,包括数据结构、数据内容(包括空间特征、专题特征和时间特征),以及拓扑性质上的内在一致性。
6)数据的完整性(Completeness):指空间数据在范围、内容及结构等方面满足所有要求的完整程度,包括数据范围、空间实体类型、空间关系分类、属性特征分类等方面。
7)数据的相容性(Compatibility):指多个来源的数据在同一个应用中的吻合程度和吻合的难易程度。
8)数据的可得性(Accessibility):指获取和使用数据的容易程度。
9)表达形式的合理性(Rationality):主要指数据抽象、数据表达时与真实地理世界的吻合性,包括空间特征、专题特征和时间特征表达的合理性等。
2.4.2空间数据质量问题的来源
1. 空间现象自身存在的复杂性、模糊性和不稳定性
空间数据质量问题首先来源于空间现象自身存在的复杂性、模糊性和不稳定性。主要包括空间位置、分布和过程、专题和属性及发生时间区段上的不确定性、模糊性。从空间现象自身的角度来看,出现空间数据质量问题是必然的。
2. 空间数据获取和表达所产生的质量问题
1)认知的不同或差异:人们对空间对象的特征和变量在概念认识上的不确切或不一致,必然导致获取、测量、记录数据上的差异和不确定;
2)测量误差:测量仪器、手段和方法的不完善、不确定以及观测时外界条件的影响,造成测量成果的误差和偏差;
3)表达方式的合理性问题:自然界和社会经济现象中事物过程的类型和特征千差万别,它们在空间和时间上的表现形式或为连续性,或为离散性,或两者兼有,但目前GIS对他们的描述都是采用点、线、面等各种符号的图形要素形式或栅格形式,这就必然存在图形表达上的合理性问题和准确性问题。
4)数据依存的物理介质问题:各类地图数据往往都是记录在纸质或聚酯材料上,这类物理介质受温度、湿度等的影响会产生变形,在使用中受磨损等都会导致图形要素的变化或差错。
3. 空间数据处理过程中产生的质量问题
空间数据处理过程主要有投影变换、数据编辑、格式转换、数据概括、数据集成、拓扑关系的建立、数据可视化表达、数据裁切与拼接等,每一个处理过程都有可能产生质量问题。
4. 空间数据使用过程中产生的质量问题
在空间数据使用的过程中也会出现质量问题,这主要包括两个方面,一是在数据的解释过程中,不同用户由于其知识背景不同,对同一空间数据的解释和理解可能不同,甚至完全相反;二是缺少文档,即缺少对某一地区不同来源的空间数据的说明,如缺少投影类型、数据定义、数据产生时间等信息,这样往往导致用户对数据的随意性使用而使误差扩散。处理这类问题的主要方法是随空间数据提供各种相关的文档说明,如元数据。
基本判断,即“空间数据质量问题不可避免”、“空间数据质量是可以控制的”。
2.4.3常见空间数据的误差分析
1. 空间数据误差的类型
空间数据的误差主要有四大类,即几何误差、属性误差、时间误差和逻辑误差。在这几种误差中,属性误差和时间误差与普通信息系统中的误差概念是一致的,几何误差是地理信息系统所特有的,而几何误差、属性误差和时间误差都会造成逻辑误差。下面主要讨论逻辑误差和几何误差。
逻辑误差:检查数据的逻辑误差,有助于发现不完整的数据和其他三类误差。对数据进行质量控制或评价时,一般先从数据的逻辑性检查入手。图2.30中,桥或停车场等与道路是相接的,如果数据库中只有桥或停车场,而没有与道路相连,则说明道路数据被遗漏,数据不完整。此外,图2.30中的水位线与交通线、相同地类图斑之间地类界线问题、植物演替规律等都存在一定的逻辑误差。
几何误差:由于地图是以二维平面坐标表达位置,所以在二维平面上的几何误差主要反映在点和线上。
1)点误差:关于某点的点误差即为测量位置(x,y)与其真实位置之间的差异。
2)线误差:线在地理信息系统数据库中既可表示线性对象,又可以通过连成的多边形表示面状对象。线误差有两种类型:第一类是线上的点在真实世界中是可以找到的,如道路、河流、输电线路等,这类线性对象的误差主要产生于测量和对数据的后期处理过程中;第二类是现实世界中找不到的,如按数学投影定义的经纬线、按高程绘制的等高线、气候区划界线、土壤类型界线、行政界线等,这类线性对象的线误差是在确定线的界限时产生的误差,因此也被称为解译误差。
2. 常见空间数据源的误差分析
GIS空间数据的常见数据源主要有地图数据、遥感数据和测量数据三大部分。
(1)地图数据
地图数据是现有地图经过数字化或扫描处理后生成的数据。在地图数据的质量问题中,不仅含有地图固有的误差,还包括物理介质变形、图形数字化误差等(陈述彭等,1999)。
1)地图固有误差:是指用于数字化的地图本身所带有的误差,包括控制点误差、投影误差等。由于这些误差间的关系很难确定,所以很难对其综合误差做出准确评价。
2)材料变形产生的误差:地图数据必须依附于一定的物理介质,而不同物理介质受温度、湿度等因素的影响有着很大的区别,必然会导致地图数据产生不同的误差。
3)图形数字化误差:例如,在扫描过程中,原图质量、扫描精度、扫描分辨率、配准精度、校正精度等方面的不同会产生不同的误差;在数字化过程中,数字化工作方式、数字化要素对象、数字化操作人员、采点方式及采点密度等的不同也会产生不同的误差。
(2)遥感数据
1)数据获取误差:由于受传感器空间分辨率、光谱分辨率及获取影像时姿态等方面的影响,存在多种降低遥感数据的几何精度和属性精度的误差,其中有些误差是可控的,如几何畸变和辐射误差;有些是不可控的,如气候条件和景观自然变化等。
2)数据预处理误差:遥感数据预处理包括幅射校正、几何校正、图像增强、多源信息复合等,这些过程都会引起各种误差。
3)数据转换误差:在栅格—矢量的转换过程中,会出现显著的位置和属性误差。引起栅格数据矢量化误差的主要原因有两个:属性概括误差和拓扑匹配错误。矢量化误差的大小与转换中所使用的算法、栅格像元的大小、以及地物的复杂性等因素有关。
4)人工判读误差:人工判读时,对空间要素的位置或属性的理解可能并不确定,从而产生误差。
(3)测量数据
系统误差的发生与一个确定的系统有关,它受环境(如温度、湿度和气压等)、仪器结构与性能、人员的观测习惯等方面的因素综合影响而产生。系统误差不能通过重复观测加以检查或消除,只能用数字模型进行模拟和估计。
偶然误差是一种随机性的误差,由一些不可测或不可控的因素引起。这种误差具有一定的特征,如有界性(绝对值不会超过一定的限值)、密集性(误差绝对值较小的可能性较大)、区间性(正负误差出现的频率大致相同)以及抵偿性(平均值趋零)等。偶然误差可采用随机模型进行估计和处理,其中最典型的方法是进行多次重复观测,取其平均值加以降低或消除。
粗差是指操作人员在使用设备、读数或记录观测值时,因粗心或操作不当而产生的错误。
2.4.4空间数据质量控制方法
1. 传统手工方法
质量控制的人工方法主要是将数字化数据与数据源进行直接比较。图形部分的检查主要通过目视方法,即将空间数据输出到透明图纸上,并与原图叠加比较进行检查;属性部分的检查主要通过与原属性进行逐个对比的方法。
2. 地图符号化方法
地图符号化质量控制技术的核心就是设计有利于目标识别和理解的符号库方案,以达到满足数据库质量检查和控制的要求。
3. 元数据跟踪方法
数据集的元数据中包含了大量的有关数据质量的信息,通过它可以检查数据质量,同时元数据也记录了数据处理过程中质量的变化,通过跟踪元数据可以了解数据质量的状况和变化。
4. 空间分析方法
空间分析功能是地理信息系统的核心功能,空间分析的很多方法(如空间叠加分析、空间统计分析等)也可以用于空间数据的质量控制之中。例如,在土地利用数据库的质量控制过程中,为检验地类符号与地类图斑的一致性,可采用空间叠加的方法来检验。
5. 地理相关法
地理相关法是用地理特征要素之间的地理相关性来分析数据的质量。例如,桥梁一般与河流相关、河流一般与较低的地势相关、自然植被往往与土壤相关、近似线状分布的泉眼往往与地下断层相关等。
本节视频

