GIS课件第3章-空间数据模型(共16页).doc
精选优质文档-倾情为你奉上第3章 空间数据模型为了能够利用地理信息系统工具解决现实世界中的问题,首先必需将复杂的地理事物和现象简化和抽象到计算机中进行表示、处理和分析。本章从空间认知的角度讲述了对现实世界进行抽象建模的过程,其结果就是空间数据模型;空间数据模型可以归纳为空间概念模型、逻辑数据模型和物理数据模型三个层次。空间概念数据模型包括:场模型:用于描述空间中连续分布的现象;对象模型:用于描述各种空间地物;网络模型:可以模拟现实世界中的各种网络。常用的空间逻辑数据模型有矢量数据模型、栅格数据模型和面向对象模型等。在讲述空间数据模型的同时,又介绍了空间实体和空间关系等相关概念。3.1地理空间与空间抽象3.1.1地理空间与空间实体在地理学上,地理空间(Geographic Space)是指地球表面及近地表空间,是地球上大气圈、水圈、生物圈、岩石圈和土壤圈交互作用的区域,地球上最复杂的物理过程、化学过程、生物过程和生物地球化学过程就发生在该区域。在地理空间中存在着复杂的空间事物或地理现象,它们可能是物质的,也可能是非物质的,如山脉、水系、土地类型、城市分布、资源分布、道路网系、环境变迁等。地理空间中的这些空间事物或地理现象就代表了现实世界;而地理信息系统即是人们通过对各种各样的地理现象的观察抽象、综合取舍,编码和简化,以数据形式存入计算机内进行操作处理,从而达到对现实世界规律进行再认识和分析决策的目的。地理空间实体就是对复杂地理事物和现象进行简化抽象得到的结果,简称空间实体,它们的一个典型特征是与一定的地理空间位置有关,都具有一定的几何形态,分布状况以及彼此之间的相互关系。空间实体具有4个基本特征:空间位置特征、属性特征、时间特征和空间关系。1 空间位置特征表示空间实体在一定的坐标系中的空间位置或几何定位,通常采用地理坐标的经纬度、空间直角坐标、平面直角坐标和极坐标等来表示。空间位置特征也称为几何特征,包括空间实体的位置、大小、形状和分布状况等。2 属性特征属性特征也称为非空间特征或专题特征,是与空间实体相联系的、表征空间实体本身性质的数据或数量,如实体的类型语义定义、量值等。属性通常分为定性和定量两种,定性属性包括名称、类型、特性等;定量属性包括数量、等级等。3 时间特征时间特征是指空间实体随着时间变化而变化的特性。空间实体的空间位置和属性相对于时间来说,可能会存在空间位置和属性同时变化的情况,如旧城区改造中,房屋密集区拆迁新建商业中心;也存在空间位置和属性独立变化的情况,即实体的空间位置不变,但属性发生变化,如土地使用权转让,或者属性不变而空间位置发生变化,如河流的改道。4 空间关系特征在地理空间中,空间实体一般都不是独立存在的,而是相互之间存在着密切的联系。这种相互联系的特性就是空间关系。空间关系包括拓扑关系(topological spatial relation)、顺序关系(order spatial relation)和度量关系(metric spatial relation)等。3.1.2 空间认知和抽象地理信息系统作为对地理空间事物和现象进行描述、表达和分析的计算机系统,首先必须将现实世界描述成计算机能理解和操作的数据形式。数据模型是对现实世界进行认知、简化和抽象表达,并将抽象结果组织成有用、能反映形式世界真实状况数据集的桥梁,是地理信息系统的基础。 由于地理空间事物和现象的复杂性和人们认识地理空间在观念或方法上的不同,地理信息系统对空间实体的抽象方式也存在一定的差别,或者说不同的学科或部门可能对地理空间按照各自的认识和思维方式来构造不同的模型。国际标准化组织(ISO)的地理信息标准化技术委员会(TC211)制定了对地理空间认知的概念模式,规范以数据管理和数据交换为目的的地理信息基本语义和结构,准确描述地理信息,规范管理地理数据,促进人们对地理空间信息有一个统一的认知和一致的使用方法,促进地理信息系统的互操作性。基本思路为:确定地理空间领域建立概念模式(概念建模)构成既方便人们认知又适合计算机解释和处理的实现模式。为了简单、明晰地描述GIS抽象过程,我们通过分析研究,归纳为三个层次来进行抽象,如图3.1所示。人们首先对地理事物进行观察,认知其类型、特征、行为和关系,再对它进行分析、判别归类、简化、抽象和综合取舍。对于同一空间目标,由于人们对其兴趣点不同,观察视点和尺度不同,分析和抽象的结果也不尽相同。例如对一栋建筑物,在宏观的尺度或小比例尺下去观察,将会和整个城市一起被简化为一个点,当在小范围或大比例尺下得到的抽象结果是完整的三维建筑物或其投影多边形。在对现实世界进行抽象、描述和表达,逐步得到概念模型,进而转换为逻辑数据模型和物理数据模型。概念模型是地理空间中地理事物与现象的抽象概念集,是地理数据的语义解释,从计算机系统的角度来看,它是抽象的最高层。构造概念模型应该遵循的基本原则是:语义表达能力强;作为用户与GIS软件之间交流的形式化语言,应易于用户理解(如ER模型);独立于具体计算机实现;尽量与系统的逻辑模型保持同一的表达形式,不需要任何转换,或者容易向逻辑数据模型转换。逻辑数据模型是GIS描述概念数据模型中实体及其关系的逻辑结构,是系统抽象的中间层。它是用户通过GIS(计算机系统)看到的现实世界地理空间。逻辑数据模型的建立既要考虑用户易理解,又要考虑易于物理实现,易于转换成物理数据模型。通常所称的空间数据模型其实是空间数据的逻辑模型。物理数据模型是概念数据模型在计算机内部具体的存储形式和操作机制,即在物理磁盘上如何存放和存取,是系统抽象的最底层。在逻辑数据模型和物理数据模型间,空间数据结构用于对逻辑数据模型描述的数据进行合理的组织,是逻辑数据模型映射为物理数据模型的中间媒介。观察和认知信息选择、综合、简化和抽象空间事物或现象概念模型Conceptial Model逻辑数据模型Logical Data Model编码、表达、建立空间关系物理数据模型Physical Data Model数据结构对数据进行组织概念世界最高层数据世界(计算机)中间层空间数据库最底层现实世界图3.2 空间实体抽象的三个层次3.2 空间数据概念模型地球表面上的各种地理现象和物体错综复杂,用不同的方法或从不同的角度对地理空间进行认知和抽象,可能产生不同的概念模型。许多方法局限于某一范围或反映地理空间的某一侧面,因此,概念模型只能体现地理空间的某一方面。根据GIS数据组织和处理方式,目前地理空间数据的逻辑模型大体上分为三类,即对象模型、网络模型和场模型,如图3.2所示。对象模型网络模型图3.2 空间数据概念模型场模型3.2.1 对象模型对象模型,也称作要素模型,将研究的整个地理空间看成一个空域,地理现象和空间实体作为独立的对象分布在该空域中。按照其空间特征分为点、线、面、体四种基本对象,对象也可能由其他对象构成复杂对象,并且与其他分离的对象保持特定的关系,如点、线、面、体之间的拓扑关系。每个对象对应着一组相关的属性以区分各个不同的对象。对象模型强调地理空间中的单个地理现象。任何现象,不论大小,只要能从概念上与其相邻的其他现象分离开来,都可以被确定为一个对象。对象模型一般适合于对具有明确边界的地理现象进行抽象建模,如建筑物、道路、公共设施和管理区域等人文现象以及湖泊、河流、岛屿和森林等自然现象,因为这些现象可被看作是离散的单个地理现象。地理空间空间要素分类几何坐标非空间属性子部分超部分空间关系非空间关系时间关系图3.3 对象模型对空间要素的描述子类/超类等效对象模型把地理现象当作空间要素(Feature)或空间实体(Entity)。一个空间要素必须同时符合三个条件:(1)可被标识;(2)在观察中的重要程度;(3)有明确的特征且可被描述。实体可按空间、时间和非空间属性以及与其他要素在空间、时间和语义上的关系来描述,如图3.3所示。传统的地图是以对象模型进行地理空间抽象和建模的典型实例。3.2.2 场模型场模型,也称作域(field)模型,是把地理空间中的现象作为连续的变量或体来看待,如大气污染程度、地表温度、土壤湿度、地形高度以及大面积空气和水域的流速和方向等。根据不同的应用,场可以表现为二维或三维。一个二维场就是在二维空间R2中任意给定的一个空间位置上,都有一个表现某现象的属性值,即Af(x,y)。一个三维场是在三维空间R3中任意给定一个空间位置上,都对应一个属性值,即Af(x,y,z)。一些现象如大气污染的空间分布本质上是三维的,但为了便于表达和分析,往往采用二维空间来表示。由于连续变化的空间现象难以观察,在研究实际问题中,往往在有限时空范围内获取足够高精度的样点观测值来表征场的变化。在不考虑时间变化时,二维空间场一般采用6种具体的场模型来描述,如图3.4所示。(1)规则分布的点。在平面区域布设数目有限、间隔固定且规则排列的样点,每个点都对应一个属性值,其他位置的属性值通过线性内插方法求得。(2)不规则分布的点。在平面区域根据需要自由选定样点,每个点都对应一个属性值,其他任意位置的属性值通过克里金内插、距离倒数加权内插等空间内插方法求得。(3)规则矩形区。将平面区域划分为规则的、间距相等的矩形区域,每个矩形区域称作格网单元(grid cell)。每个格网单元对应一个属性值,而忽略格网单元内部属性的细节变化。(4)不规则多边形区。将平面区域划分为简单连通的多边形区域,每个多边形区域的边界由一组点所定义;每个多边形区域对应一个属性常量值,而忽略区域内部属性的细节变化。(5)不规则三角形区。将平面区域划分为简单连通三角形区域,三角形的顶点由样点定义,且每个顶点对应一个属性值;三角形区域内部任意位置的属性值通过线性内插函数得到。(6)等值线。用一组等值线C1,C2,Cn,将平面区域划分成若干个区域。每条等值线对应一个属性值,两条等值线中间区域任意位置的属性是这两条等值线的连续插值。(a) 规则分布的点(b) 不规则分布的点(c)规则矩形区(d) 不规则多边形区(e) 不规则三角形区(f) 等值线图3.4 场模型的6种表示3.2.3 网络模型网络模型与对象模型的某些方面相同,都是描述不连续的地理现象,不同之处在于它需要考虑通过路径相互连接多个地理现象之间的连通情况。网络是由欧式空间R2中的若干点及它们之间相互连接的线(段)构成,亦即在地理空间中,通过无数“通道”互相连接的一组地理空间位置。现实世界许多地理事物和现象可以构成网络,如公路、铁路、通讯线路、管道、自然界中的物质流、物量流和信息流等,都可以表示成相应的点之间的连线,由此构成现实世界中多种多样的地理网络。由于网络是由一系列节点和环链组成的,从本质上看与对象模型没有本质的区别。按照基于对象的观点,网络模型也可以看成对象模型的一个特例,它是由点对象和线对象之间的拓扑空间关系构成的。因此可将空间数据概念模型归结为对象模型(或称要素模型)和场模型(或称域模型)两类。3.2.4 概念模型的选择地理现象既可以采用对象模型也可以采用场模型建模。以一个有不同林分覆盖的森林为例(图3.5),讨论两种不同概念模型的建模。从场模型来看,森林可建模为一个函数。该函数的定义域就是森林占据的地理空间,而值域是3个元素(林种的名称)的集合。设这个函数为f,它将森林占据的每个点映射到值域的一个具体元素上。函数f是一个分段函数,它在林种相同的地方取值恒定,而在林种发生变化处才改变取值。以对象观点来看,在明确规定林分之间的界限的理想情况下,就可以得到多边形的边界,每个多边形都有一个惟一的标识符和一个非空间属性林分的名称。这样,就可以把森林建模为一个多边形集合,每个多边形对应一个林分。松树冷杉槐树(0,0)(0,4)(0,7)(3,0)(7,0)x区域ID主要林分区域/边界FS1松树(0,4),(7,4),(7,7),(0,7)FS2冷杉(0,0),(3,0),(3,4),(0,4)FS3槐树(3,0),(7,0),(7,4),(3,4) “松树”,0x4;4y7f (x,y)= “冷杉”,0x3;0y4 “槐树”,3x7;0y4(a) 多种林分的森林(b) 按对象模型的林分建模(c) 按场模型的林分建模图3.5 森林的两类模型对比y对于一个空间应用来说,到底采用对象模型还是场模型进行空间建模,则主要取决于应用要求和习惯。对于现状不定的现象,例如火灾、洪水和危险物泄漏,当然采用边界不固定的场模型进行建模。场模型通常用于具有连续空间变化趋势的现象,如海拔、温度、土壤变化等。其实在遥感领域,主要利用卫星和飞机上的传感器收集地表数据,此时场模型是占主导地位的。对象模型一般用于具有明确边界和独立地理现象的建模,如道路、地块的征税和使用权等方面的建模。同时,应该指出,对象和场可以在多种水平上共存,即在许多情况下需要采用对象模型和场模型的集成,对象模型和场模型各有长处,应该恰当地综合应用这两种模型对地理现象进行抽象建模。不论是在空间数据的概念建模中,或是在GIS的数据结构设计中,还是GIS的应用中,都会遇到这两种模型的集成问题。例如,如果采集降雨数据的各个点在空间上很分散且分布无规律,并且这些采集点还有各自的特征,那么,一个包含两个属性采集数据点位置(对象)和平均降雨量(场)的概念模型,也许更适合于对区域降雨现象特性变化的描述。3.3 空间数据与空间关系 3.3.1空间数据类型及其表示1. 空间数据类型地理信息中的数据来源和数据类型很多,概括起来主要有以下五种:(1) 几何图形数据。来源于各种类型的地图和实测几何数据。几何图形数据不仅反映空间实体的地理位置,还要反映实体间的空间关系。(2) 影像数据。主要来源于卫星遥感、航空遥感和摄影测量等。(3) 属性数据。来源于实测数据,文字报告,或地图中的各类符号说明,以及从遥感影像数据通过解释得到的信息等。(4) 地形数据。来源于地形等高线图中的数字化,已建立的格网状的数字化高程模型(DTM),或其他形式表示的地形表面(如TIN)等。(5) 元数据。对空间数据进行推理、分析和总结得到的关于数据的数据,如数据来源、数据权属、数据产生的时间、数据精度、数据分辨率、元数据比例尺、地理空间参考基准、数据转换方法等。在具有智能化的GIS中还应有规则和知识数据。2. 空间数据的表示这些不同类型的数据都可抽象表示为点、线、面三种基本的图形要素,如图3.6所示。实体点结点面标识点弧段面xy图3.6 空间数据的抽象表示岛(1)点(Point),点既可以是一个标识空间点状实体,如水塔,也可以是标记点,仅用于特征的标注和说明,或作为面域的内点用于标明该面域的属性,或是线的起点、终点或交点,则称为结点(Node)。(2)线(Line),具有相同属性点的轨迹,线的起点和终点表明了线的方向。道路、河流、地形线、区域边界等均属于线状地物可抽象为线。线上各点具有相同的公共属性并至少存在一个属性。当线连接两个结点时,也称作弧段(Arc)或链(Link)。 (3)面(Area),是线包围的有界连续的具有相同属性值的面域,或称为多边形(Polygon)。多边形可以嵌套,被多边形包含的多边形称为岛。空间的点、线、面可以按一定的地理意义组成区域(Region),有时称为一个覆盖(Coverage),或数据平面(Data Plane)。各种专题图在GIS中都可以表示为一个数据平面。3.3.2空间关系空间关系是指地理空间实体之间相互作用的关系。空间关系主要有:(1)拓扑空间关系:用来描述实体间的相邻、连通、包含和相交等关系;(2)顺序空间关系:用于描述实体在地理空间上的排列顺序,如实体之间前后、上下、左右和东、南、西、北等方位关系;(3)度量空间关系:用于描述空间实体之间的距离远近等关系。对空间关系的描述是多种多样的,有定量的,也有定性的,有精确的,也有模糊的。各种空间关系的描述也非绝对独立,而是具有一定联系。对空间关系的描述和表达,是GIS能够进行复杂空间分析的重要原因。1. 空间拓扑关系地图上的拓扑关系是指图形在保持连续状态下的变形(缩放、旋转和拉伸等),但图形关系不变的性质。地图上各种图形的形状、大小会随图形的变形而改变,但是图形要素间的邻接关系、关联关系、包含关系和连通关系保持不变。俗称的拓扑关系是绘在橡皮上的图形关系,或者说拓扑空间中不考虑距离函数。如图3.7所示,设N1,为结点;A1,A2为线段(弧段);P1,P2,为面(多边形),空间数据的拓扑关系包括:N1N2N3N5A3P3P2P4A1N4P1A2A4A5A6A7图3.7 空间数据的拓扑关系(1)邻接关系。空间图形中同类元素之间的拓扑关系。例如多边形之间的邻接关系P1与P2、P4,P4与P1、P2、P4等;结点之间的邻接关系N1与N2、N3等;(2)关联关系。空间图形中不同类元素之间的拓扑关系。例如结点与弧段的关联关系N1与A1、A2、A3; N2与A1、A6、A7等;弧段与多边形的关联关系A1与P1, A2与P1等;弧段与结点的关联关系A1与N1、N2,A2与N1、N3等;多边形与弧段的拓扑关联关系P1与A1、A2、A7,P4与A2、A3、A5、A4等。(3)包含关系。空间图形中不同类或同类但不同级元素之间的拓扑关系。例如多边形P4中包含P3。(4)连通关系。空间图形中弧段之间的拓扑关系。例如A1与A2、A6和A7连通。由于上述拓扑关系中,有些关系可以通过其它关系得到,所以在实际描述空间关系时,一般仅将其中的部分关系表示出来,而其余关系则隐含其中,如连通关系可以通过结点与弧段以及弧段与结点的关联关系得到。如果要将结点、弧段、面块相互之间主要拓扑关系表达出来,可以组成四个关系表,即表3.1,表3.2,表3.3和表3.4。例如表3.3对于网络分析非常重要,而对于主要表达面状目标的GIS系统来说则可以省略。表3.1中,弧段前的负号表示面域中含有岛;表3.2中弧段的始结点和终结点给出了弧段的方向;表3.4中,弧段的左邻面和右邻面为沿弧段前进方向左、右两侧的多边形,由弧段的方向确定;P0为多边形外围的虚多边形编号。表3.1 面域与弧段的拓扑关系面域弧段P1A1,A2,A7P2A5,A6,A7P3A4P4A2,A3,A5,-A4表3.2 弧段与结点的拓扑关系弧段始结点终结点A1N2N1A2N1N3A3N1N5A4N4N4A5N3N5A6N5N2A7N3N2表3.4 弧段与面域的拓扑关系弧段左邻面右邻面A1P0P1A2P1P4A3P4P0A4P3P4A5P2P4A6P0P2A7P2P1表3.3 结点与弧段的拓扑关系结点弧段N1A1,A2,A3N2A1,A6,A7N3A2,A5,A7N4A4N5A3,A5,A6除了在逻辑上定义结点、弧段和多边形来描述图形要素的拓扑关系外,不同类型的空间实体间也存在着拓扑关系。分析点、线、面三种类型的空间实体,它们两两之间存在着分离、相邻、重合、包含或覆盖、相交5种可能的关系,如图3.8所示。邻接相交重合相离包含点点µã点线点面线面面面线线图3.8 不同类型空间实体间的空间关系邻接(1)点点关系。点实体和点实体之间之间只存在相离和重合两种关系。如两个分离的村庄,变压器与电线杆在投影至平面空间上重合。(2)点线关系。 点实体和线实体间存在着相邻、相离和包含三种关系。如水闸和水渠相邻;道路与学校相离;里程碑包含在高速公路中。(3)点面关系。点实体与面实体间存在着相邻、相离和包含三种关系。如水库与多个泄洪闸门相邻,闸门位于水库的边界上;公园与远处的电视发射塔相离;耕地含有输电杆。(4)线线关系。线实体与线实体间存在着相邻、相交、相离、包含、重合关系。如供水主干管道与次干管道相邻(连通);铁路和公路平面相交;国道和高速公路相离;河流中包含通航线;道路与沿道路铺设的管线在平面上重合。(5)线面关系。线实体与面实体间存在着相邻、相交、相离、包含关系。如水库与上游及下游河流相邻;跨湖泊的通讯光纤与湖泊相交;远离某乡镇区域的高速公路;在某县境内的干渠等。(6)面面关系。面实体与面实体间存在着相邻、相交、相离、包含、重合关系。例如地籍中相邻的两块宗地;土地利用图斑与地层类型图斑相交;某县域内包含多个乡镇;宗地与建筑物底面重合等。空间数据的拓扑关系,对数据处理和空间分析具有重要的意义:(1) 拓扑关系能清楚地反映实体之间的逻辑结构关系,它比几何坐标关系有更大的稳定性,不随投影变换而变化。(2) 利用拓扑关系有利于空间要素的查询,例如,某条铁路通过哪些地区,某县与哪些县邻接。又如分析某河流能为哪些地区的居民提供水源,某湖泊周围的土地类型及对生物、栖息环境作出评价等。(3) 可以根据拓扑关系重建地理实体。例如根据弧段构建多边形,实现道路的选取,进行最佳路径的选择等。因此在描述空间数据的逻辑模型时,通常将拓扑空间关系作为一个主要的内容。2. 空间顺序关系顺序空间关系是基于空间实体在地理空间的分布,采用上下、左右、前后、东南西北等方向性名词来描述。同拓扑空间关系的形式化描述类似,也可以按点点、点线、点面、线线、线面和面面等多种组合来考察不同类型空间实体间的顺序关系(图3.9)。由于顺序空间关系必须是在对空间实体间方位进行计算后才能得出相应的方位描述,而这种计算非常复杂。实体间的顺序空间关系的构建目前尚没有很好的解决方法,另外随着空间数据的投影、几何变换,顺序空间关系也会发生变化,所以在现在的GIS中,并不对顺序空间关系进行描述和表达。基准方向基准方向基准方向(a)点点顺序关系(b)点线顺序关系(c)点面顺序关系(d)线线顺序关系(e)线面顺序关系(f)面面顺序关系基准方向基准方向基准方向图3.9 不同类型实体间的顺序关系从计算的角度来看,点点顺序关系只要计算两点连线与某一基准方向的夹角即可。同样,在计算点实体与线实体、点实体与面实体的顺序空间关系时,只要将线实体和面实体简化至其中心,并将其视为点实体,按点点顺序关系进行计算。但这种简化需要判断点实体是否落入线实体或面实体内部。而且这种简化的计算在很多情况下会得出错误的方位关系,如点与呈月牙型的面的顺序关系。在计算线线、线面和面面实体间的顺序关系时,情况变得异常复杂。当实体渐渐的距离很大时,此时实体的大小和形状对它们之间的顺序关系没有影响,则可将其转化为点,其顺序关系则转化为点点之间的顺序关系。但当它们之间距离较小时,则难以计算。3. 度量空间关系度量空间关系主要指空间实体间的距离关系。也可以按照拓扑空间关系中建立点点、点线、点面、线线、线面和面面等不同组合来考察不同类型空间实体间的度量关系。距离的度量可以是定量的,如按欧几里德距离计算得出A实体距离B实体500m,也可以应用与距离概念相关的概念如远近等进行定性地描述。与顺序空间关系类似,距离值随投影和几何变换而变化。建立点点的度量关系容易、点线和点面的度量关系较难,而线线、线面和面面的度量关系更为困难,涉及大量的判断和计算。在GIS中,一般也不明确描述度量空间关系。3.4 空间数据逻辑模型 空间数据逻辑模型作为概念模型向物理模型转换的桥梁,根据概念模型确定的空间信息内容,以计算机能理解和处理的形式具体地表达空间实体及其关系。针对对象模型和场模型两类概念模型,一般采用矢量数据模型、栅格数据模型、矢量栅格一体化数据模型、镶嵌数据模型、面向对象数据模型等逻辑模型来进行空间实体及其关系的逻辑表达。空间数据概念模型与逻辑模型不是一一对应的,而是存在着一定的交叉关系。例如,采用对象模型建模的地理现象可采用具有拓扑关系或不仅有拓扑关系表达的矢量数据模型,也可采用面向对象数据模型;而场模型中的6种建模方式,可分别采用栅格数据模型(图3.4中(a)、(c)、矢量数据模型(图3.4中(d)、(f)以及镶嵌数据模型(图3.4中(e)。应当指出,地理空间现象本质上是时空四维的。但是在GIS中,为了简化对空间实体的描述及其关系的表达,将空间现象随时间的变化特征按不同时间点分别描述或将属性加上时间标记;将三维空间实体投影到二维平面,在R2地理空间构造对实体及其关系表达的空间数据逻辑模型。3.4.1 矢量数据模型矢量数据模型起源于“Spaghetti模型”,这是一种产生于计算机地图制图的数据模型,适合于用对象模型抽象的地理空间对象,如图3.10所示。在矢量数据模型中,点实体用一对空间坐标表示,二维空间中对应为(x,y);线实体由一串坐标对组成,二维空间中表示为(x1,y1),(x2,y2),(xn,yn);面由其边界线表示,表示为首尾相连的坐标串,二维空间中对应为(x1,y1),(x2,y2),(xn,yn),(x1,y1)。每一个实体都给定一个惟一标识符(Identifier)来标识该实体。矢量数据模型能够精确地表示点、线及多边形面的实体,并且能方便地进行比例尺变换、投影变换以及输出到笔式绘图仪上或视频显示器上。电力塔图3.10 空间对象的矢量数据模型实体类型实体ID类别位置点5电力塔x1, y1点6电力塔x1, y1线4河流x1, y1;x2, y2;xn, yn多边形1杨树林x1, y1;x2, y2;xn, yn; x1, y1多边形2杨树林x1, y1;x2, y2;xn, yn; x1, y1多边形3松树林x1, y1;x2, y2;xn, yn; x1, y1杨树林松树林2314河流56如果空间实体的空间特征信息(位置)连同属性信息一起组织并存储,则根据属性特征的不同,点可用不同的符号来表示,线可用不同的颜色、粗细不等、样式不同的线型绘制,多边形则可以填充不同的颜色和图案。在矢量数据模型中,可以明确地描述图形要素间的拓扑关系。在具有拓扑关系的矢量数据模型中,多边形边界被分割成一系列的弧段和结点。结点、弧段和多边形之间的拓扑关系在拓扑关系表中(如表3.1表3.4)。与Spaghetti模型相比,相邻多边形间的公共边界仅需表达一次,减少了描述的数据量,且避免了双重边界不能精确重合的问题。图3-11 空间对象的栅格数据模型在矢量数据模型中,空间实体现象是由点、线和面等原型实体及其集合来表示。观察的尺度或者概括的程度影响着使用原型的种类。在小比例尺图中,城镇这类对象可以用点表示,道路和河流由线表示。在较大比例尺图中,城镇被表示为一定形状的多边形,包括建筑物的边界、公园、道路等实体。3.4.2 栅格数据模型栅格数据模型比较适宜于用场模型抽象的的空间对象,采用面域或空域的枚举来直接描述空间实体。栅格可以用数字矩阵来表示,地理空间坐标隐含在矩阵的行列上。数字扫描仪、视频数字化仪、行式打印机、喷墨绘图仪等设备是基于栅格模式的。应用栅格数据模型进行数字图象处理和分析已被广泛应用于遥感、医学图象、计算机视觉等领域。在栅格数据模型中,点实体是一个栅格单元(cell)或像元,线实体由一串彼此相连的像元构成,面实体则由一系列相邻的像元构成,像元的大小是一致的,如图3.11所示。每个像元对应于一个表示该实体属性的值。若需要描述统一地理空间的不同属性,则按不同的属性将数据分层,每层描述一种属性。当栅格单元太粗糙,未能与空间目标相吻合时,就会丢失某些高分辨率情况下的细节信息。栅格单元的形状通常是正方形,有时也采用矩形。栅格的行列信息和原点的地理位置被记录在每一层中。栅格的空间分辨率是指一个像元在地面所代表的实际面积大小。对于一个面积为100km2的区域,以10m的分辨率来表示则需要有10000×10000个栅格,即1亿个像元。如果每个像元占一个计算机存储单元,即一个字节(Byte),那么这幅图象就要占用100兆字节的存储空间,这是相当大的。随着分辨率的提高,对存储空间的要求将成几何级数地增加。因此,在栅格数据模型中,选择空间分辨率时必须考虑存储空间和处理时间的开销。同时,往往需要籍助相应的空间数据结构来组织数据并压缩数据量,以节省存储空间。栅格数据模型的一个优点是不同类型的空间数据层可以进行叠加操作,不需要经过复杂的几何计算。但对于一些变换、运算,如比例尺变换、投影变换等则操作不太方便。3.4.3矢量栅格一体化数据模型矢量数据模型和栅格数据模型在描述和表达空间实体时各有优缺点。将两种数据模型的优点结合起来,构造矢量栅格一体化数据模型,将有利于地理空间现象的统一表达。在矢量栅格数据模型中,对地理空间实体同时按矢量数据模型和栅格数据模型来表述。面状实体的边界采用矢量数据模型描述,而其内部采用栅格数据模型表达;线状实体一般采用矢量数据模型表达,同时将线所经过位置以栅格单元进行充填;点实体则同时描述其空间坐标以及栅格单元位置,这样则将矢量数据模型和栅格数据模型的特点有机地结合在一起。矢量栅格一体化数据模型一方面保留了矢量数据模型的全部特性,空间实体具有明确的位置信息,并能建立和描述拓扑关系;另一方面又建立了栅格与实体的联系,即明确了栅格与实体的对应关系。从本质上说,矢量栅格数据模型是一种以栅格为基础的数据模型,对空间实体及其关系描述的数据量增大。 3.4.4镶嵌数据模型镶嵌(Tessellation)数据模型采用规则或不规则的小面块集合来逼近自然界不规则的地理单元,适合于用场模型抽象的地理现象。通过描述小面块的几何形态、相邻关系及面块内属性特征的变化来建立空间数据的逻辑模型。小面块之间不重叠且能完整铺满整个地理空间。根据面块的形状,镶嵌数据模型可分为规则镶嵌数据模型和不规则镶嵌数据模型。一、规则镶嵌数据模型规则镶嵌数据模型,即用规则的小面块集合来逼近自然界不规则的地理单元。在实际应用中,普遍采用正方形或矩形进行地理空间的划分。此时的规则镶嵌数据模型就转化为栅格数据模型。构造规则镶嵌的具体做法是;用数学手段将一个铺盖网格叠置在所研究的区域上,把连续的地理空间离散为互不覆盖的面块单元(网格)。划分之后,简单化了空间变化的描述,同时也使得空间关系(如毗邻、方向和距离等)明确,可进行快速的布尔集合运算。在这种结构中每个网格的有关信息都是基本的存储单元。从数据结构上看,规则网格系统的主要优点在于其数据结构为通常的二维矩阵结构,每个网格单元表示二维空间的一个位置,不管是沿水平方向还是沿垂直方向均能方便地遍历这种结构。处理这种结构的算法很多,并且大多数程序语言中都有矩阵处理功能。此外,以矩阵形式存储的数据具有隐式坐标,不需要进行坐标数字化;规则格网系统还便于实现多要素的叠置分析。因而,规则镶嵌是一种重要的空间数据处理工具。二、不规则镶嵌数据模型不规则镶嵌数据结构是指用来进行镶嵌的小面块具有不规则的形状或边界。最典型的不规则镶嵌数据模型有Voronoi图(也称作Thiessen多边形)和不规则三角网(Triangular Irregular Network,简称TIN)模型,如图3.12所示。当用有限离散的观测样点来表示某地理现象的空间分布规律时,适合于采用不规则镶嵌数据模型。图3.12 TIN和Voronoi多边形数据模型图中虚线为Voronoi多边形的边界,实线为TIN边,小圆点代表采样观测点Voronoi图是俄国数学家M.G. Voronoi于1908年发现的几何构造,并以他的名字命名,早在1850年,另一位数学家G.L.Dirichelt同样研究过几何构造,有时也称为Dirichelt格网。由于Voronoi图在空间剖分上的等分性特征,在许多领域获得了应用,也产生了多种叫法,通常以最先将其应用到专业领域的专家的名字来命名。Voronoi多边形的特点是:组成多边形的边总是与两相邻样点的连线垂直,并且多边形内的任何位置总是离该多边形内样点的距离最近,离相邻多边形内样点的距离远,且每个多边形内包含且仅包含一个样点。以Voronoi多边形内的样点属性作为整个多边形区域的属性。因此只要给定具有若干空间离散点,根据Voronoi多边形的构造方法就可获得完整覆盖地理区域的Voronoi多边形。表达Voronoi多边形的顶点位置、Voronoi多边形各边与顶点的连接关系、多边形间的连接关系,以及Voronoi多边形包含的样点就可得到Voronoi多边形的逻辑数据模型。除表达地理空间现象外,Voronoi多边形还可有效地用于许多空间分析问题,如邻接、接近度(Proximity)和可达性分析等,以及解决最近点(closest point)、最小封闭圆问题。TIN采用不规则的三角网形成对地理空间的完整覆盖。在TIN模型中,样点的位置控制着三角形的顶点,这些三角形尽可能接近等边。TIN能较好的表达地理现象的空间变化,如地形表面就可用三角网拟合,此时三角形看作是空间的三角面片。三角网的优点是,三角形大小随样点密度的变化自动变化,所有样点都称为三角形的顶点,当样点密集时生成的三角形小,而样点较稀时则三角形较大。TIN在表示不连续地理现象时也具有优势,如用TIN表示地形的变化,将悬崖、断层、海岸线、山谷山脊线等作为约束条件,可构造约束TIN。在TIN模型中,有一种与Voronoi多边形对偶的Delaunay三角网,这是一种满足最大空圆准则的三