目录

  • 1 地理信息科学教材封面
    • 1.1 封面
    • 1.2 内容简介
    • 1.3 编委会名单
    • 1.4 丛书序-李德仁院士
    • 1.5 丛书前言-汤国安
    • 1.6 前言--闾国年
    • 1.7 目录
    • 1.8 地理信息科学导论课程介绍
  • 2 从贵阳疫情地图说地理信息科学
    • 2.1 1 20220831贵阳第一例新冠患者
    • 2.2 2 贵阳快速发展的疫情
    • 2.3 3 贵阳疫情防控的静默理由
    • 2.4 4 病例背后的地理空间行为
    • 2.5 5 探寻疫情背后地理的空间逻辑
    • 2.6 6 我所理解的地理信息科学与自我发展
    • 2.7 ESRI 从COVID-19疫情看未来空间大数据应用与机遇网络会议视频
    • 2.8 武汉大学抗疫-地图的力量V1.6
  • 3 第一章 从地理到地理信息科学
    • 3.1 1.1 地理现象的认知与表达
    • 3.2 1.2 地理信息科学的兴起
    • 3.3 1.3 地理现象时空分析的地理信息系统表达
    • 3.4 思考题
    • 3.5 延伸阅读
  • 4 第二章 地理信息科学内涵
    • 4.1 2.1地理信息科学基本概念
    • 4.2 2.2地理信息科学的性质与研究对象
    • 4.3 2.3地理信息科学体系
    • 4.4 思考题
    • 4.5 延伸阅读
  • 5 第三章 地理抽象与地图表达
    • 5.1 3.1人类地理空间思维与地图出现
    • 5.2 3.2地图的特征与类型
    • 5.3 3.3现代地图的发展
    • 5.4 3.4地图的应用
    • 5.5 3.5地图的价值
    • 5.6 3.6地图的制作
    • 5.7 思考题
    • 5.8 延伸阅读
  • 6 第四章 空间位置与定位导航
    • 6.1 4.1地理位置及其定位与表达
    • 6.2 4.2卫星定位导航
    • 6.3 4.3室内定位导航
    • 6.4 4.4 混合定位导航
    • 6.5 4.5基于位置的地理信息服务
    • 6.6 思考题
    • 6.7 延伸阅读
  • 7 第五章 地理数据获取与航测遥感
    • 7.1 5.1地球观测的遥感需求
    • 7.2 5.2遥感原理与遥感技术系统
    • 7.3 5.3几何数据的遥感获取
    • 7.4 5.4物理参数的遥感获取
    • 7.5 5.5遥感地学分析、应用与服务
    • 7.6 思考题
    • 7.7 延伸阅读
  • 8 第六章 地理动态数据采集、传输与物联网技术
    • 8.1 6.1地球系统监测与动态地理信息
    • 8.2 6.2互联网与物联网
    • 8.3 6.3物联网组成与功能
    • 8.4 6.4基于物联网系统的动态地理数据 采集
    • 8.5 思考题
    • 8.6 延伸阅读
  • 9 第七章 地理数据处理与地理信息系统
    • 9.1 7.1人脑作用与电脑意义
    • 9.2 7.2地理数据的数据存储
    • 9.3 7.3地理分析与模拟
    • 9.4 7.4地理表达
    • 9.5 7.5地理信息的网络传输
    • 9.6 7.6地理信息系统地学研究与社会服务
    • 9.7 思考题
    • 9.8 延伸阅读
  • 10 第八章 地理信息产业发展
    • 10.1 8.1地理信息产业
    • 10.2 8.2我国地理信息产业发展
    • 10.3 8.3我国地理信息企业状况
    • 10.4 8.4我国地理信息产业空间格局
    • 10.5 8.5地理信息产业发展的热点
    • 10.6 思考题
    • 10.7 延伸阅读
  • 11 主要参考文献
    • 11.1 主要参考文献
  • 12 纪念陈述彭先生诞辰100周年学术研讨会20201128
    • 12.1 纪念陈述彭先生诞辰100周年学术研讨会20201128视频
  • 13 全大学生GIS应用技能大赛暨地理学人才培养高峰论坛
    • 13.1 第十届全大学生GIS应用技能大赛暨地理学人才培养高峰论坛
  • 14 北斗导航
    • 14.1 3集北斗导航-濮存昕
    • 14.2 2017军武大本营-张召忠-卜庆军-谈北斗
  • 15 星链卫星
    • 15.1 星链卫星的军事化阴谋
7.3地理分析与模拟



7.3 地理分析与模拟

建模是构造现实世界中与研究对象相关的模型的过程。在建模中,首先观测研究对象,然后在忽略次要因素和不可观测因素的基础上,使用物理和数学的方法进行抽象,建立与实际对象近似的模型。建模的重点是探讨研究对象与模型之间的关系,同时,所建立的模型要尽可能地接近研究对象。

    模拟是一种实验方法,是模型构建和应用的过程。模拟首先是针对特定的研究对象构建一个模型,然后利用该模型对研究对象进行各种实验,其目的是为了研究对象的行为,评估在一定的限制条件下研究对象的各种变化和不同对策所产生的结果。常用的分析模型包括基本空间分析、统计分析、时序分析、智能分析与机理过程分析模型等。

7.3.1空间分析

1.查询

空间数据查询属于空间数据库的范畴,一般定义为从空间数据集中找出所有满足属性约束条件和空间约束条件的地理对象。查询的过程大致可分为三类:①直接复原数据集中的数据及所含信息,来回答人们提出的一些比较“简单”的问题;②通过一些逻辑运算完成一定约束条件下的查询;③根据数据集中现有的数据模型,进行有机地组合构造出复合模型,模拟现实世界的一些系统和现象的结构、功能,来回答一些“复杂”的问题,预测一些事务的发生、发展的动态趋势。空间数据查询的一般过程如图7.14所示。

 

空间数据查询的方式主要有两大类,即“属性查图形”和“图形查属性”。属性查图形,主要是用SQL语句来进行简单和复杂的条件查询。地理信息系统软件通常都支持标准的SQL查询语言。

如图7.15所示,找出902号建筑物周围500m内的所有建筑物,将符合条件的建筑物的属性与图形关联,然后在图上高亮度显示给用户。

 

7.16为“图形查属性”示例,既可以通过点、矩形、圆和多边形等图形来查询所选空间对象的属性,也可以查找空间对象的几何参数,如两点间的距离,线状地物的长度,面状地物的面积等。

空间数据查询的内容很多,可以查询空间对象的属性、空间位置、空间分布、几何特征,以及和其他空间对象的空间关系。查询的结果可以通过多种方式显示给用户,如高亮度显示、属性列表和统计图表等。

 

2.量测

1)距离

    “距离”是人们日常生活中经常涉及的概念,它描述了两个实体或事物之间的远近或亲疏程度。距离的量算与度量空间的介质有关,可区分为匀质空间和非匀质空间(图7.17)。

 

2)面积

面积是面状地物最基本的参数。在GIS中,梯形法是进行多边形面积量算的主要方法之一,其基本思想是:在平面直角坐标系中,按多边形定点顺序依次求出多边形所有边与x轴(或Y轴)组成的梯形的面积,然后求其代数和(图7.18)。

 

 

3)形状

    不同的二维平面物体的形状有不同的测度,相似的形状应有描述该物体形状的近似数值。    与用类似平行四边形、梯形和三角形等几何形状来描述多边形形状特征相比,用圆来描述最简单、最紧凑。圆有理想的凸度,因为圆的表面没有凹面或锯齿形。用圆来描述多边形形状特征的测量方法叫做测量多边形的凸度或凹度方法。

4)质心

    质心是描述地理对象空间分布的一个重要指标。质心通常定义为一个多边形或面的几何中心,当多边形比较简单,如矩形,计算就比较简单;当多边形复杂时,计算也会更复杂。

    在某些情况下,质心描述的是分布中心,而不是绝对几何中心。以某区域的人均年收人为例,当绝大部分人均年收人明显集中于该区域的一侧时,可以把质心放在分布中心,这种中心称为平均中心或重心。

    质心量测经常用于宏观经济分析和市场区位选择,还可以跟踪某些地理分布的变化,如人口变迁、土地类型变化等。

5)坡度

地表面任一点的坡度是指过该点的切平面与水平地面的夹角。坡度表示了地表面在该点的倾斜程度,在数值上等于过该点的地表微分单元的法矢量与z轴的夹角(图7.19)。

 

6)坡向

    坡向定义为:地表面上一点的切平面的法线矢量n在水平面的投影nsoy与过该点的正北方向的夹角(图7.19)。对于地面任何一点来说,坡向表征了该点高程值改变量的最大变化方向。在输出的坡向数据中,坡向值有如下规定:正北方向为0度,按顺时针方向旋转计算,取值范围为0--360度。

3.缓冲区

    缓冲区分析是地理信息系统中常用的一种空间分析方法,是对空间特征进行度量的一种重要手段。缓冲区分析是研究根据数据库的点、线、面实体,自动建立其周围一定宽度范围内的缓冲区多边形实体,从而实现空间数据在水平方向得以扩展的分析方法。

    缓冲区是地理空间目标的一种影响范围或服务范围在尺度上的表现。它是一种因变量,随所研究的要素的形态而改变。从数学的角度来看,缓冲区是给定空间对象或集合后获得的它们的邻域,而邻域的大小由邻域的半径或缓冲区建立的条件来决定。

    缓冲区建立的形态多种多样,这是根据缓冲区建立的条件来确定的,常用的对于点状要素有圆形,也有三角形、矩形和环形等;对于线状要素有双侧对称、双侧不对称或单侧缓冲区;对于面状要素有内侧和外侧缓冲区。这些形体各不相同,可以适合不同的应用需求。但是从总体上来说,都是根据空间目标的不同建立的不同缓冲区,所以从缓冲区对象方面来看,最基本的缓冲区可分为点缓冲区、线缓冲区和面缓冲区。

1)点缓冲区

    点缓冲区是选择单个点、一组点、一类点状要素或一层点状要素,按照给定的缓冲条件建立缓冲区结果(图7.20,不同的缓冲条件下,单个或多个点状要素建立的缓冲区不同)。例如,工厂、飞机场和其他设施对周围产生的噪声污染的区域大小。

2)线缓冲区

线缓冲区是选择一类或一组线状要素,按照给定的缓冲条件建立缓冲区结果(图7.21)。例如,在林业方面规定距河流两岸一定范围内禁止砍伐树木。

 

 

3)面缓冲区

    面缓冲区是选择一类或一组面状要素,按照给定的缓冲条件建立缓冲区结果。面缓冲区由于自身缓冲区建立的原因,存在内缓冲区和外缓冲区之分。外缓冲区是仅仅在面状地物的外围形成缓冲区,内缓冲区则在面状地物的内侧形成缓冲区,同时也可以在面状地物的边界两侧形成缓冲区(图7.22)。例如,为失火区域找到距其500m范围内所有的消防水管。

 

7.23给出的是一个关于缓冲区分析的实例:某城市医院的服务影响范围。首先选择全部医院,以医院的大小的量化值作为缓冲距离建立缓冲区,并对这些缓冲区进行图形叠加,得到未被影响范围覆盖的区域。图上深色区域即为得到的缓冲区。

 

4.叠置分析

    叠置分析是将有关主题层组成的各个数据层面进行叠置产生一个新的数据层面,其结果综合了原来两个或多个层面要素所具有的属性,同时叠置分析不仅生成了新的空间关系,而且还将输人的多个数据层的属性联系起来产生新的属性关系。其中,被叠加的要素层面必须是基于相同坐标系统的、基准面相同的、同一区域的数据。

    按照GIS中最常用的两种数据结构将叠置分析分成矢量数据叠置分析和栅格数据叠置分析,如图7.24所示。

 

 

根据操作要素的不同,可以将矢量数据叠置分析分成点与多边形叠加、线与多边形叠加、边形与多边形叠加;栅格数据叠置分析分为单层与多层栅格数据叠置分析

例如,一个县各乡镇农作物产量图与该县的乡镇行政图进行叠置分析后,更新点属性表,可以计算各乡镇有多少种农作物及其产量,或者查询哪些农作物在哪些乡镇有分布等信息(图 7.25)。

 

例如,河流网络与乡镇区划图进行叠置分析,这样河流网络图层中的各个河流的线属性表,将不仅包含原河流的信息,还含有该河流所在行政区的标号和其他信息,可以依此得到任意省市内的河流的分布密度和长度等(图7.26)

5.网络分析

现实世界中若干线状要素相互连接成网状结构,资源沿着这个线性网流动,就构成一个网络。在 GIS 作为空间实体的网络与图论中的网络是不同的。空间实体的网络作为一种复杂的地理目标除具有一般网络的边、结点间抽象的拓扑含义之外,还具有空间定位上的地理意义和目标复合上的层次意义。具体说来,网络就是指现实世界中,由链和结点组成的、带有环路,并伴随着一系列支配网络中流动之约束条件的线网图形。它的基础数据是点与线组成的网络数据。

网络分析通过模拟、分析网络的状态以及资源在网络上的流动和分配等,研究网络结构、流动效率及网络资源等的优化。对地理网络、城市基础设施网络进行地理分析和模型化,是地理信息系统中网络分析的主要功能。进行网络分析研究的数学分支是图论和运筹学,它的根本目的是研究、筹划一项基于网络数据的工程如何安排,并使其运行效果最好 如一定资源的最佳分配,从一地到另一地花费的时间最短等。研究内容主要包括选择最佳路径,选择最佳布局中心的位置,资源分配,结点弧段的遍历等。其基本思想则在于人类活动总是趋向于按一定目标选择达到最住效果的空间位置。这类问题在生产、社会、经济活动中不胜枚举,因此研究此类问题具有重大意义。目前网络分析在电子导航、交通旅游各种城市管网和配送、急救等领域发挥着重要作用。生活中应用网络分析的实例有很多例如,从甲地到乙地的最短路径是什么?如何设定一个服务中心?特定位置的服务中心的服务范围?从一个位置到另一个位置的通行程度如何?从出发地到目的地,有多少条可行路线?如何在图上定位发生的事件?如图 7.27 中加粗线即为通过网络分析得到的从南京师范大学仙林校区到新街口的最佳路径。

 

资源分配模型可用来进行城镇中心、商业中心或港口等地的吸引范围分析,以用来找区域中最近的商业中心,进行各种区划和港目腹地的模拟等(7.28)

 

6.密度分析

密度分析是用离散点生成面的一个基本方法。密度制图是指根据输入的要素数据集计 算整个区域的数据集状况,从而产生一个连续的密度表面。该制图方法主要基于点数据生成,以每个待计算格网点为中心,进行圆形区域搜索,进而计算每个格网点的密度值。密  度的高低反映数据的分布趋势和热点、冷点。图 7.29 所示为入室盗窃犯罪密度制图,颜色较深的区域表示入室盗窃犯罪聚集较高

 

 

7.3.2 空间统计

统计分析是空间分析的主要手段,贯穿于空间分析的各个主要环节。空间统计分析方法不只限于常规统计方法,还包括空间自相关分析等

大部分的地理现象都具有空间相关特性,即距离越近的两事物越相似。这一特性也地统计分析的基础。空间自相关分析包括全局空间自相关分析和局部空间自相关分析相关分析的结果可用来解释和寻找存在的空间聚集性或焦点空间自相关分析需要时 空问数据类型是点或面数据,分析的对象是具有点/面分布特征的特定属性

全局空间自相关用来分析在整个研究范围内指定的属性是否具有自相关性;局部空间

自相关用来分析在特定的局部地点指定的属性是否具有自相关性。具有正自相关的属性其相邻位置值与当前位置的值具有较高的相似性。常用的空间自相关指数有 Moran3s1 Geary ' C

在对我国 31 个省级行政区(港澳台数据暂缺)人均 GDP 进行空间关联分析时,根据各省(自治区、直辖市)之间的邻接关系,采用二进制邻接权重矩阵,选取各省(自治区直辖市)1990200 年人均 GDP 的自然对数,依照公式计算全局 Moran1,计算其检验的标准化统计量,结果如表 7.1 所示

 

    1从表中可以看出,在19992002年,全局Moran指数均为正值,说明我国31个省级行政区人均GDP存在显著的、正的空间自相关。

    2)各省级行政区人均GDP水平的空间分布并非表现出完全的随机性,而是表现出相似值之间的空间集聚。其空间联系的特征是:较高人均GDP水平的省级行政区相对地趋于和较高人均GDP水平的省级行政区相邻,或者较低人均GDP水平的省级行政区相对地趋于和较低人均GDP水平的省级行政区相邻。

7.3.3时序分析

    时间序列是按时间次序排列的随机变量序列。时序分析是一种动态数据处理的统计方法,该方法基于随机过程理论和数理统计学方法,研究随机数据序列所遵从的统计规律以用于解决实际问题。主要包括谱分析、统计模型的建立与推断以及关于时间序列的最优预测、控制与滤波等内容。

1.频谱分析

    频谱分析是一种将复杂噪声信号分解为较简单信号的技术。许多物理信号均可以表示为许多不同频率简单信号的和。找出一个信号在不同频率下的信息(可能是幅度、功率、强度或相位等)的做法就是频谱分析。

频谱分析可应用于地震勘探,只要掌握了干扰波出现的规律,在野外采集时选择仪器上合适的滤波档,就能将其“拒之门外”;在室内处理时,有针对性地设计滤波器,将其滤除,以提高资料的信噪比。频谱分析也可应用于对GPS轨迹进行抽稀。

2.小波分析

    小波分析(wavelet analysis)是指用有限长或快速衰减的、称为母小波(mother wavelet)的振荡波形来表示信号。该波形被缩放和平移以匹配输人的信号。

    小波分析的应用领域十分广泛,主要有:数学领域;信号分析、图像处理;量子力学、理论物理;军事电子对抗与武器的智能化;计算机分类与识别;音乐与语言的人工合成;医学成像与诊断;地震勘探数据处理;大型机械的故障诊断等。

7.3.4智能分析

智能是个体有目的的行为、合理的思维以及有效地适应环境的综合能力。智能分析不是单一的方法,而是众多方法和技术的集合。大体而言,智能分析主要包括智能体(agent)、元胞自动机(cellalar automation, CA)、人工蜂群算法(artificial bee colony, ABC)、自组织映射(self-organizing mapSOM)等方法。

1.智能体

    智能体是指具有各种特性的计算机程序。它具有以下特性:自主性,意味着它具有独立的行为能力;反应性,意味着它可以对当前环境以不同的方式进行反应;目标导向性,意味着它利用自身的能力寻求问题的答案。

    7.30所示为一个典型的基于智能体建模的模型,展示的是一个地铁大厅区域(地下铁路站点)内行人移动模拟结果的截图。模型显示了客流的真实建模:乘客占据物理空间,相互看到,避开障碍物,站在队列中,根据观察的情况修改他们的速度和方向。

2.元胞自动机

    元胞自动机(CA)是一种时间、空间、状态都离散,空间的相互作用及时间上的因果关系皆局部的网格动力学模型。一般元胞自动机以一维单元串或二维矩形单元格来建模,也可以使用其他形状(如六边形、不规则形状)。

    构建简单的CA模型,其状态和规则可以表示地理过程。当然,在实际应用中必须要对基本的CA框架加一些规则,如数值型的/多于一个变量的元胞状态,具有概率效应的/距离衰减效应的规则。

    CA通常用于城市扩张、土地利用变化、林火、动植物动态变化等的模拟。图7.31所示为CA用于城市发展预测模拟的案例。

    城市扩展是多种因素综合作用的结果,其扩展的形式也是多种多样的。城市扩展模拟中的CA模型演变规则是依据城市本身扩展的特征以及对其扩展影响程度较大的几个方面定义的。CA模型的具体扩展规则主要包括:CA惯性自由扩展、土地利用类型转变、交通引力作用、大城市辐射等。

 

 

 

3.人工蜂群算法

    蜂群算法是一种模仿蜜蜂繁殖、采蜜等行为的新兴群智能(swarm intelligence)优化算法。在2005年为了解决多变量函数优化问题,Karaboga提出了人工蜂群算法(ABC)模型。

    按照机理不同,人工蜂群算法可以分为两类:受婚配行为启发的蜜蜂婚配优化算法,也称为基于蜜蜂繁殖机理的蜂群算法;受采蜜行为启发的蜜蜂采蜜优化算法。另外,还有模拟蜂王繁殖行为的蜂王进化算法,模拟蜜蜂躲避障碍物的蜜蜂躲避算法,模拟蜂群任务分配行为的可用于服务器动态分配的分散蜜蜂算法等。

    目前,人工蜂群算法的应用研究已经从最初的函数优化领域发展到神经网络训练、图像处理、无线通信、数据挖掘、组合优化、电子学、软件和控制工程等领域。此外,也应用到了GIS领域。如图7.32所示为一个人工蜂群算法寻优的例子,用于在CIELab色空间中寻找一个能耗较低的颜色。

 

4.自组织映射

    自组织映射(SOM)算法是一种非监督学习方法,具有良好的自组织、可视化等特性,广泛应用于样本分类、排序和样本检测等方面。

    它作为一种聚类和高维可视化的非监督学习算法,是通过模拟人脑对信号处理的特点而发展起来的一种人工神经网络。该模型由芬兰赫尔辛基大学教授Teuvo Kohonen1981年提出,他认为,一个神经网络接受外界输人模式时,将会分为不同的对应区域,各区域对输人模式有不同的响应特征,而这个过程是自动完成的。SOM网络正是根据这一看法提出的,其特点与人脑的自组织特性相类似。

如图7.33所示,SOM网络由输入层和竞争层(输出层)组成。输入层神经元数为n,竞争层由,个神经元组成一维或者二维平面阵列,网络是全连接的,即每个输人结点都和所有的输出结点相连接。

 

    SOM网络能将任意维输入模式在输出层映射成一维或二维图形,并保持其拓扑结构不变;网络通过对输人模式的反复学习可以使权重向量空间与输人模式的概率分布趋于一致,即概率保持性。网络的竞争层各神经元竞争对输人模式的响应机会,获胜神经元有关的各权重朝着更有利于它竞争的方向调整,即“以获胜神经元为圆心,对近邻的神经元表现出兴奋性侧反馈,而对远邻的神经元表现出抑制性侧反馈,近邻者相互激励,远邻者相互抑制”。一般而言,近邻是指以发出信号的神经元为圆心,半径为50--500}im的神经元;远邻是指半径为200Vm2mm的神经元。比远邻更远的神经元则表现为弱激励作用,如图7.34所示。因为这种交互作用的曲线类似于墨西哥人戴的帽子,所以也称这种交互方式为“墨西哥帽”。

 

 

 

 

 

 

SOM算法以其所具有的诸如拓扑结构保持、概率分布保持、非监督学习及可视化等特性吸引了广泛的注意,各种关于SOM算法应用研究的成果不断涌现。现已广泛应用于语音识别、图像处理、分类聚类、组合优化、数据分析和预测等众多信息处理领域。图7.35是一个用SOM实施空间聚类的案例。

 

 

 

7.3.5机理过程分析

    机理模型是在一定的假设下,根据主要因素相互作用的机理,对它们之间的作用关系的数学描述。根据过程的内部机理,运用一些已知的定理、原理,如物理或化学的变化规律建立系统模型的方法称为机理建模方法,建模的过程叫做机理建模,所建模型叫做机理模型。机理过程分析模型包括水循环模型、大气运动模型、海洋潮波模型等。

    SWATsoil and water assessment tool)模型为分布式水文模型,是由美国农业部农业研究中心Jeff Arnold博士于1994年开发的。模型开发的最初目的是为了预测在大流域复杂多变的土壤类型、土地利用方式和管理措施条件下,土地管理对水分、泥沙和化学物质的长期影响。SWAT模型采用天为时间连续计算,是一种基于GIS基础之上的分布式流域水文模型,近年来得到了快速的发展和应用。它主要是利用遥感和地理信息系统提供的地理信息,模拟多种不同的水文物理化学过程,如水量、水质,以及杀虫剂的输移与转化过程。

    SWAT是一个物理机制模型,可以进行连续时间序列的水文模拟。SWAT模拟的流域水文过程分为水文循环的陆地阶段(即产流和坡面汇流部分)和水文循环的汇流阶段(即河道汇流部分)。前者控制着每个子流域内主河道的水、沙、营养物质和化学物质等的输人量;后者决定水、沙等物质从河网向流域出口的输移运动。整个水分循环系统遵循水量平衡规律(图7.36)。