第1章 空间数据库概述精选文档.ppt
第1章 空间数据库概述本讲稿第一页,共四十页第一章 空间数据库概述n第一节 空间数据库概念n第二节 空间数据库的研究内容2 2本讲稿第二页,共四十页一、为什么要研究空间数据库n数据库(DataBase,简称DB):l存放数据的仓库。l长期存储在计算机内的、有组织的、可共享的数据集合。3 3本讲稿第三页,共四十页一、为什么要研究空间数据库n数据库管理系统(数据库管理系统(DataBase Management System,简称,简称DBMS):):l位于用户和操作系统之间的,管理控制DB的建立、运行和维护的软件。l具有数据定义、数据操纵、数据库运行、数据库建立和维护功能。属性数据!属性数据!4 4本讲稿第四页,共四十页一、为什么要研究空间数据库nGIS的出现激发了人们开发空间数据库的兴趣。nGIS提供了便于分析地理数据和将地理数据可视化的机制。nGIS 可以对某些对象和图层进行多种操作。nGIS还可以用来处理海量空间数据。n而实际上GIS就是空间数据库的前端!5 5本讲稿第五页,共四十页一、为什么要研究空间数据库n例如“列出2011年销售总额的前十位顾客”n对DBMS而言很简单n顺序扫描或者索引6 6本讲稿第六页,共四十页一、为什么要研究空间数据库n例如“列出居住在离公司总部50公里以内的顾客”n这会难住普通的DBMSn要处理这个查询,必须把公司总部和顾客的地址变换到一个能够计算和比较距离的适当参照系中,可能是经纬度坐标系,n然后数据库扫描顾客列表计算顾客和公司之间的距离n如果距离小于50英里保存顾客名字。n这一过程无法用索引来缩小搜索范围,因为传统索引无法处理多维数据的排序问题。n所以迫切需要能处理空间数据和查询的数据库。7 7本讲稿第七页,共四十页二、定义:n空间数据库(Spatial DataBase Management System,SDBMS)l描述、存储和处理空间数据及其属性数据的数据库系统。8 8本讲稿第八页,共四十页三、空间数据库的作用n1、对海量数据的管理能力。n2、空间分析功能。n3、设计方式灵活,满足用户要求。n4、支持网络功能。9 9本讲稿第九页,共四十页四、空间数据库的特征n多种数据类型特征(5D产品,矢量或栅格)n空间特征(空间位置、空间属性、空间关系)n非结构化特征(属性定长结构、空间坐标和空间关系变长结构)n图形图像特征(结果可视化)n数据编码特征(数据分类分级编码)n海量数据特征1010本讲稿第十页,共四十页五、SDBMS的发展n文件管理方式n二元化空间数据库管理系统n全关系型空间数据库管理系统n对象关系空间数据库管理系统n面向对象空间数据库管理系统1111本讲稿第十一页,共四十页1、文件管理方式n最初当数据库技术还不是很成熟的时候,GIS应用采用文件系统存储数据。n每个GIS应用都对应自己的空间和属性数据文件,当多个应用需要访问的数据有相同部分时,就将这些数据提取出来,存放在一个新的公共数据文件中。1212本讲稿第十二页,共四十页图形文件属性文件GIS应用文件图形信息属性信息数据文件1数据文件1数据文件nGIS应用1GIS应用2GIS应用n公共数据文件11313本讲稿第十三页,共四十页2、二元化空间数据库管理系统n定义:属性数据用关系数据库管理,坐标数据用文件管理,两者间建立联系n优点:实现空间数据管理、速度较快n缺点:数据的安全性、一致性、完整性、并发控制性、数据恢复较差,没有解决空间对象反向检索问题1414本讲稿第十四页,共四十页图形文件GIS应用文件关系数据库图形信息属性信息1515本讲稿第十五页,共四十页3、全关系型空间数据库管理系统n定义:属性数据和坐标数据用关系数据库统一管理n关系数据库提供了Binay(二进制)字段,变长的坐标数据采用该字段管理n优点:一体化管理,数据的安全性、一致性、完整性、并发控制性、数据恢复较好n缺点:速度慢,没有解决空间对象反向检索问题1616本讲稿第十六页,共四十页4、对象关系空间数据库管理系统n定义:关系数据库推出了空间数据管理的模块,定义了操纵空间对象的API函数,属性数据和坐标数据用关系数据库统一管理n优点:一体化管理,数据的安全性、一致性、完整性、并发控制性、数据恢复较好,速度较快n缺点:部分解决空间对象反向检索问题1717本讲稿第十七页,共四十页4.对象关系数据库管理n实现:l在关系数据库管理系统中进行扩展,使之能直接存贮和管理非结构化的空间数据,l主要解决了空间数据的变长记录的管理,l由数据库软件商进行扩展,效率要比前面所述的二进制块的管理高得多。l但是仍然没有解决对象的嵌套问题,空间数据结构也不能由用户任意定义,使用上仍然受到一定限制。1818本讲稿第十八页,共四十页GIS厂商开发的空间数据管理模块 ESRI:ARCSDE MapInfo:Spatialware关系数据库管理系统厂商直接开发的空间数据管理模块 Oracle Spatial Informix Ingres DB21919本讲稿第十九页,共四十页5、面向对象空间数据库管理系统n定义:能满足上述所有需求n它不仅支持变长记录,而且支持对象的嵌套、信息的继承与聚集。n允许用户定义对象和对象的数据结构以及它的操作。l这种空间数据结构可以是不带拓扑关系的面条数据结构,也可以是拓扑数据结构,当采用拓扑数据结构时,往往涉及对象的嵌套、对象的连接和对象与信息聚集。n面向对象的数据模型不成熟n没有面向对象空间数据库管理系统2020本讲稿第二十页,共四十页第二节 空间数据库的研究内容n空间数据模型 n空间数据的管理方式n空间数据查询语言 n查询优化n索引n数据挖掘n2121本讲稿第二十一页,共四十页一、空间数据模型n空间数据模型就是寻求一种描述地理实体的有效的数据表示方法,根据应用要求建立实体的数据结构和实体之间的关系以便于应用。n经典的空间数据模型分为两大类:基于场的和基于对象的模型。2222本讲稿第二十二页,共四十页1 基于场的模型n基于场的数据模型中,将信息空间视为在空间结构上一定分布的集合体,每一个空间分布被规则化成一个从空间框架到空间属性的数据函数。2323本讲稿第二十三页,共四十页n基于场的模型使用矩阵或栅格的单元来显示、定位和存贮地理数据:利用一个唯一的参考坐标代表每个在矩阵边缘或内部的单元或点,而每个单元或点上被赋予离散的属性值;基于场的模型中的分辨率依赖于单元或栅格的大小,不同的场模型中的分辨率可能有很大的差别。2424本讲稿第二十四页,共四十页nGIS常常需要在不同的数据层存贮各种不同的信息如植被、土质、水文或其他信息等,不同的数据层对应不同的地理属性。数字区域模型DTM(Digital Terrain Model)和数字高程模型DEM(Digital Elevation Model)是典型的基于场的空间数据模型。2525本讲稿第二十五页,共四十页2 基于对象的模型n基于对象的模型以带有属性数据的点、直线、曲线或区域来显示地理数据:笛卡尔坐标系统及其上的算法定义了向量系统中的点、直线和曲线都可以用点来表示,即,可视为一个有序点集。n基于对象的模型可以方便的存贮空间拓扑关系,也适用于方位、距离分析,相对于基于场的模型,要求更少的存贮空间但要求更复杂的数据结构。2626本讲稿第二十六页,共四十页nGIS成功的关键取决于人们对现实世界认识和模拟的正确程度。由于面向对象的方法能够模拟和操纵复杂对象,能够将人们对于地理空间的认识正确映射到计算机内,面向对象的开发思想正逐步成为GIS开发的基本方式。2727本讲稿第二十七页,共四十页n用面向对象的观点来看,可将地理空间数据归结为空间实体、图层、地图3个层次:l地理空间实体:指具有空间分布特征和一定几何形态的事物和现象,可分为资源、环境、经济和社会以及地质、地形、气候、植物、耕地、水文、经济与社会等。包括空间要素和属性要素。2828本讲稿第二十八页,共四十页n图层:l指一定空间范围内具有相同属性要素的一组同类地理空间实体。需要注意的是,GIS中图层概念并不是地理空间实体的简单堆砌,而是在某种特殊应用领域下空间实体的组合,并且相互之间有着密切的联系。l采用图层的方式来组织地理空间数据可以表达地理空间数据的分布性:(1)对于地理位置上分布的空间数据,可以按空间范围划分图层,如全国铁路交通图,就可以由各个省市的铁路交通图组成;(2)对于空间范围相同的空间数据,可根据应用的需要(即专题)人为地划分到不同的图层里,如武汉市交通图,按交通的种类可分为一级,二级公路等图层。2929本讲稿第二十九页,共四十页n地图:l指在实际应用系统中为表达更现实的语义而对图层按照空间范围或专题进行的组合。如城市规划地图上,包括交通,电力,水力,煤气管道等多个图层,对应于现实生活中城市规划时需要牵涉到的各个部门。3030本讲稿第三十页,共四十页3131本讲稿第三十一页,共四十页二、空间数据查询语言 空间查询空间数据属性数据属性查询空间数据库SQL?3232本讲稿第三十二页,共四十页n目前,空间查询语言的设计大体有l基于基于SQL扩展的空间查询语言扩展的空间查询语言l可视化查询语言可视化查询语言l自然查询语言自然查询语言。3333本讲稿第三十三页,共四十页四、查询优化n由于空间数据具有结构复杂、数据量庞大等特点,使得面向空间数据的查询比单纯的属性数据查询要复杂的多。n因此空间数据查询的效率成为了空间数据库性能的瓶颈,而现有的关系数据库查询优化技术不能完全适用于空间数据,所以查询优化技术的研究势必成为空间数据库应用的难点和突破点。3434本讲稿第三十四页,共四十页空间数据库例如:将查询分两步进行:即初次过滤和二次筛选 3535本讲稿第三十五页,共四十页5123467123123636本讲稿第三十六页,共四十页五、索引n空间数据索引l作为一种辅助性的空间数据结构,介于空间操作算法和地理对象之间,它通过筛选,排除大量与特定空间操作无关的地理对象,从而缩小了空间数据的操作范围,提高了空间操作的速度和效率。3737本讲稿第三十七页,共四十页n空间数据索引采用分割原理,把查询空间划分为若干区域(通常为矩形或多边形)。这些区域或单元包含空间数据并可惟一标识。n空间索引是用特定的数据结构和算法来完成的,目前高效的空间索引有R树、R+树、格网索引法、BSP树、KDP树、CELL树、四叉树等。3838本讲稿第三十八页,共四十页六、数据挖掘n“人们被数据淹没,但却饥饿于知识”n数据挖掘(Data Mining),又称为数据库中的知识发现(Knowledge Discovery in Database,KDD),l就是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程,简单的说,数据挖掘就是从大量数据中提取或“挖掘”知识。3939本讲稿第三十九页,共四十页n空间数据挖掘(Spatial Data Mining),也称基于空间数据库的数据挖掘和知识发现,是指从空间数据库中提取用户感兴趣的空间模式与特征、空间与非空间数据的普遍关系及其它一些隐含在数据库中的普遍的数据特征。空间数据挖掘是数据挖掘的一个新的分支。4040本讲稿第四十页,共四十页