空间数据分析分析解析只是课件.ppt
《空间数据分析分析解析只是课件.ppt》由会员分享,可在线阅读,更多相关《空间数据分析分析解析只是课件.ppt(354页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、空间数据分析分析解析1.4空间建模空间建模 建立模型预测空间过程与结果建立模型预测空间过程与结果2空间分析的研究进展空间分析的研究进展 线性回归是计量革命的核心技术线性回归是计量革命的核心技术,于是就出于是就出现了计量地理学现了计量地理学,但计量地理学主要移植了统计但计量地理学主要移植了统计分析方法分析方法,如相关分析,回归分析如相关分析,回归分析,聚类分析聚类分析,因因子分析子分析,而对空间模式而对空间模式,空间过程空间过程,空间相互作用空间相互作用等理论与方法介绍的很少等理论与方法介绍的很少,因此受到了批评因此受到了批评.1970-1980,空间分析方法发展中非常空间分析方法发展中非常重要
2、的时代重要的时代,在这一时期围绕地理现象的空间在这一时期围绕地理现象的空间本质或地理数据的空间性质本质或地理数据的空间性质,建立了地理学的建立了地理学的空间分析方法与体系空间分析方法与体系.1969年年,Tobler提出了提出了地理学第一定理地理学第一定理:任何事物都是空间相关的任何事物都是空间相关的,距离近的事物空间相关性大距离近的事物空间相关性大.Clifford在在1973年出版的专著中揭示了空间自相关的年出版的专著中揭示了空间自相关的概念概念,展示空间随机条件下如何检验回归误差展示空间随机条件下如何检验回归误差,并揭示了空间加权矩阵的本质并揭示了空间加权矩阵的本质.1981年年Ripl
3、ey对空间点分布模式进行对空间点分布模式进行了研究了研究,提出了测度空间点模式的提出了测度空间点模式的K函数方法函数方法,OpenShaw对空间数据中的可塑面积单元对空间数据中的可塑面积单元问题进行了深入研究问题进行了深入研究,这对正确使用空间数这对正确使用空间数据及解释空间结果意义重大据及解释空间结果意义重大.Anslin提出描述局部相关性的测度方提出描述局部相关性的测度方法与统计量法与统计量,这一时期空间相关性的空间回这一时期空间相关性的空间回归模型与空间自回归模型被提出归模型与空间自回归模型被提出,导致空间导致空间计量经济学的出现计量经济学的出现.20世纪世纪90年代年代,空间分析的发展
4、与空间分析的发展与GIS的发展紧密结合在一起的发展紧密结合在一起,GIS为空间分为空间分析提供了广泛的数据源析提供了广泛的数据源,空间分析集中体现空间分析集中体现在以下在以下4个方面个方面:1)GIS的数据革命极大地促进了空间分析的数据革命极大地促进了空间分析在众多领域的应用在众多领域的应用.2)数据环境发生了巨大的变化数据环境发生了巨大的变化,空间分析需空间分析需要的海量数据要的海量数据,迫切需要新一代的以数据为迫切需要新一代的以数据为驱动的地理探索与建模工具驱动的地理探索与建模工具,使分析处理过使分析处理过程中多维复杂性不被忽略程中多维复杂性不被忽略.3)高性能计算机的出现高性能计算机的出
5、现,使复杂数据处理的使复杂数据处理的空间分析成为可能空间分析成为可能.4)神经网络神经网络,遗传算法成为空间分析的范例遗传算法成为空间分析的范例 空间分析的研究内容空间分析的研究内容1)空间数据模型与地理世界的表示空间数据模型与地理世界的表示2)探索性空间数据分析与可视化探索性空间数据分析与可视化3)空间数据的性质空间数据的性质4)空间数据分析的点模式方法空间数据分析的点模式方法5)面数据的空间分析方法与空间回归模型面数据的空间分析方法与空间回归模型6)空间连续数据的分析方法空间连续数据的分析方法7)地图代数与栅格数据建模技术地图代数与栅格数据建模技术8)地理模型与决策支持地理模型与决策支持第
6、第2章章 空间数据的性质空间数据的性质2.1地理世界的概念模型与数据模型地理世界的概念模型与数据模型 对现实世界进行高度抽象对现实世界进行高度抽象,概括其概念模型概括其概念模型,然后建立适应于计算机存储与表示的数据模型然后建立适应于计算机存储与表示的数据模型.2.1.1地理世界的概念模型地理世界的概念模型1)离散实体离散实体 通过其独特的局部化特征相互区别通过其独特的局部化特征相互区别,通过特通过特定属性的个体被识别定属性的个体被识别,如建筑物如建筑物,街道等街道等.离散对象观的重要特征是可以计数离散对象观的重要特征是可以计数.维数是离散实体的显著特征维数是离散实体的显著特征,实体自然被实体自
7、然被抽象为点抽象为点(只有位置的只有位置的0维实体维实体),线线(具有长度具有长度属性的一维实体属性的一维实体)和多边形和多边形(占据一定面积的占据一定面积的2维实体维实体).点点,线与多边形的抽象与研究与空间尺度有线与多边形的抽象与研究与空间尺度有关关,如大尺度时城市就是一个点如大尺度时城市就是一个点,城市为研究对城市为研究对象时就是一个多边形象时就是一个多边形.具有连续变化的自然现象不适合用离散对象具有连续变化的自然现象不适合用离散对象方法表示方法表示.空间对象的几何形态与属性特征共同构成空间对象的几何形态与属性特征共同构成地理信息的完整信息地理信息的完整信息.属性特征常用表描述属性特征常
8、用表描述,表表的一行是一个离散实体的一行是一个离散实体,一列是对象一个属性一列是对象一个属性.离散对象也可以表示连续变化的场离散对象也可以表示连续变化的场,如用如用等高线表示地形的连续起伏等高线表示地形的连续起伏,线的稀疏表示线的稀疏表示空间变化的剃度空间变化的剃度.2)连续场连续场(标量场与矢量场标量场与矢量场)用连续表面描述地理现象的方法叫场的观用连续表面描述地理现象的方法叫场的观点点,场的观点认为世界被很多变量描述场的观点认为世界被很多变量描述,每一每一变量在任何可能的位置都是可测量的变量在任何可能的位置都是可测量的.连续场描述的是空间连续场描述的是空间-时间框架下地理变时间框架下地理变
9、量的空间变化量的空间变化.表示连续世界的空间数据模型都是某种程表示连续世界的空间数据模型都是某种程度的近似度的近似,这些模型包括这些模型包括:规则规则(不规则不规则)的空的空间点间点,等值线等值线,规则单元格规则单元格,不规则三角网不规则三角网,及及多边形等多边形等.点模型与线模型不能完整地表示场点模型与线模型不能完整地表示场,因为所关心的地理变量的值只存在于特定的因为所关心的地理变量的值只存在于特定的点或线的位置上点或线的位置上.空间插值的方法将基于点或线的模型转化空间插值的方法将基于点或线的模型转化为基于面的模型为基于面的模型,如三角网如三角网,多边形多边形.不规则多边形表示场是经常使用的
10、一种近似不规则多边形表示场是经常使用的一种近似技术技术,如如Thiessen多边形多边形.提出及原理提出及原理:荷兰气候学荷兰气候学AHThiessen提提出根据离散分布气象站的降雨量计算平均降雨量出根据离散分布气象站的降雨量计算平均降雨量的方法,即将所有相邻气象站连成三角形,作这的方法,即将所有相邻气象站连成三角形,作这些三角形各边的垂直平分线,每个气象站周围的些三角形各边的垂直平分线,每个气象站周围的若干垂直平分线便围成一个多边形。用这个多边若干垂直平分线便围成一个多边形。用这个多边形内所包含的一个唯一气象站的降雨强度来表示形内所包含的一个唯一气象站的降雨强度来表示这个多边形区域内的降雨强
11、度这个多边形区域内的降雨强度 泰森多边形的特性是:泰森多边形的特性是:1),每个泰森多边形内仅含有一个离散点数据;每个泰森多边形内仅含有一个离散点数据;2),泰森多边形内的点到相应离散点的距离最近;泰森多边形内的点到相应离散点的距离最近;3),位于泰森多边形边上的点到其两边的离位于泰森多边形边上的点到其两边的离 散点的距离相等散点的距离相等2.1.2 GIS空间数据模型空间数据模型-矢量与栅格矢量与栅格 离散对象与连续场只考虑了地理现象的概念离散对象与连续场只考虑了地理现象的概念或方式或方式,不能以数字的形式表示地理数据不能以数字的形式表示地理数据.1)栅格数据栅格数据 栅格表示中栅格表示中,
12、地理空间被划分成矩形单元格地理空间被划分成矩形单元格矩阵矩阵,所有的地理变化通过对单元格赋予性质或所有的地理变化通过对单元格赋予性质或属性来表示属性来表示,但单元格内部的细节变化信息都但单元格内部的细节变化信息都丢失了丢失了,单元格有时被称为像素单元格有时被称为像素,如遥感影象是如遥感影象是典型的栅格数据典型的栅格数据.最大份额法最大份额法:当一个单元格是多个区域的交当一个单元格是多个区域的交 叉地域时叉地域时,单元格中占面积份额最大的区域单元格中占面积份额最大的区域拥有这个单元格拥有这个单元格.中心点法中心点法:中心点所属区域拥有此单元格中心点所属区域拥有此单元格.2)矢量数据矢量数据 矢量
13、数据表示中矢量数据表示中,所有的线通过点直线连所有的线通过点直线连接而成接而成,区域通过一系列点之间的直线连接区域通过一系列点之间的直线连接,用多折线表示曲线用多折线表示曲线.矢量形式表示的区域矢量形式表示的区域:形成区域多边形顶点的形成区域多边形顶点的 点被获取点被获取,此方法表示区域比栅格简单此方法表示区域比栅格简单,因栅因栅格表示多边形需列出所有单元格格表示多边形需列出所有单元格.2.1.3属性数据的测度属性数据的测度 地理信息中的属性非常广泛地理信息中的属性非常广泛,有的是自然或有的是自然或环境的,有的是社会或经济的环境的,有的是社会或经济的,区分属性信息区分属性信息的测度类型很重要的
14、测度类型很重要.量测层次上将属性数据分为离散尺度或连量测层次上将属性数据分为离散尺度或连续尺度续尺度,定性的或定量的定性的或定量的.更详细的划分如下更详细的划分如下:变量类型变量类型空间表示空间表示 点点 线线 面面 表示表示名义名义(=)案发地的案发地的分类分类道路是否道路是否在修补在修补环境保护环境保护的功能区的功能区土地利用土地利用类型类型序数序数()区域中城区域中城镇按收入镇按收入水平排序水平排序道路的等道路的等级分类级分类城市中各城市中各县的收入县的收入水平水平土壤质量土壤质量等级等级间距间距各城镇的各城镇的产值份额产值份额河流的平河流的平均海拔高均海拔高度度城市中各城市中各县的产值
15、县的产值份额份额地表温度地表温度比率比率连锁店销连锁店销售额售额道路道路.河河流长度流长度区域的人区域的人均收入均收入降水量降水量名义属性名义属性:是对地理实体的分类是对地理实体的分类,地理对象的名称地理对象的名称是最好的例子是最好的例子,名义属性包括数字名义属性包括数字,文字文字,甚至颜色甚至颜色.对数字的名义属性进行运算没有任何意义对数字的名义属性进行运算没有任何意义.序数属性序数属性:序数属性的类型存在等级关系序数属性的类型存在等级关系,序数属序数属性的算术运算也没有任何意义性的算术运算也没有任何意义.如区域收入等级如区域收入等级划分划分.平均数无意义平均数无意义,中位数则有意义中位数则
16、有意义.间距属性间距属性:一个值对另一个值的差异幅度一个值对另一个值的差异幅度,而不是而不是该值与真实零点之间的差值该值与真实零点之间的差值,因此数量关系的运算因此数量关系的运算受到限制受到限制,加减运算有效加减运算有效,乘除无效乘除无效.比率属性比率属性:数值与真实零点之间差异幅度的数值与真实零点之间差异幅度的度量度量,两个比率数值之间的加减乘除运算是有两个比率数值之间的加减乘除运算是有效的效的,如如100Kg人的重量是人的重量是50Kg人的两倍人的两倍.空间广延量空间广延量(面积面积)与空间强度量与空间强度量(密度密度).此外还要注意数据的方向与周期此外还要注意数据的方向与周期.空间数据的
17、性质空间数据的性质空间数据的性质直接影响空间分析与建模空间数据的性质直接影响空间分析与建模.1空间依赖性与空间异质性空间依赖性与空间异质性1.1空间依赖性空间依赖性 空间上距离相近事物的相似性比距离远的空间上距离相近事物的相似性比距离远的事物的相似性大事物的相似性大.其含义如下其含义如下:空间某一位置空间某一位置i,某变量的值与其邻近位置某变量的值与其邻近位置j上的观测值有关上的观测值有关,其形式为其形式为:假如地理现象是由一个过程及其表述的假如地理现象是由一个过程及其表述的环境定义环境定义,过程表示现象基本因素的变化过程表示现象基本因素的变化,环境表示现象的观测框架环境表示现象的观测框架(空
18、间与时间空间与时间),空空间依赖性表示环境对过程的重要影响间依赖性表示环境对过程的重要影响.这样传统统计理论关于独立同分布的假这样传统统计理论关于独立同分布的假设是不成立的设是不成立的.空间依赖性是通过空间自相关测度的空间依赖性是通过空间自相关测度的,空间自相关的指标多样空间自相关的指标多样,可分为全局测度与可分为全局测度与局部测度局部测度.全局测度全局测度给出研究区域整体的一个参数或指数给出研究区域整体的一个参数或指数局部测度局部测度提供与数据观测点等量的参数或指数提供与数据观测点等量的参数或指数1.2空间异质性空间异质性 异质性表明空间数据的变化不是平稳的异质性表明空间数据的变化不是平稳的
19、,但但在局部其变化可能是一致的在局部其变化可能是一致的,于是就出现了局于是就出现了局部模型部模型,但局部模型的应用会增加空间数据分但局部模型的应用会增加空间数据分析的误差与不确定性析的误差与不确定性.空间每一点的地理要素空间每一点的地理要素之间存在不同的关系之间存在不同的关系:如如都是空间观测数据都是空间观测数据如房屋价格与如房屋价格与CBD距离关系的空间异质性距离关系的空间异质性1.3可塑性面积单元问题与生态缪误可塑性面积单元问题与生态缪误 面积单元对分析结果的影响面积单元对分析结果的影响,1)尺度效应尺度效应:空间单元经聚合改变尺度大小时空间单元经聚合改变尺度大小时,空间数据的空间数据的统
20、计分析结果也会发生变化统计分析结果也会发生变化,且不同聚合方案且不同聚合方案得到不同的结果得到不同的结果.2)划区效应划区效应:不同聚合方式不同聚合方式对分析结果的影响对分析结果的影响.可塑性面积单元问题是由区域数量可塑性面积单元问题是由区域数量,规模规模,形状对空间数据分析的影响形状对空间数据分析的影响.P24有关两种效应的说明有关两种效应的说明MAUP对政治也有影响对政治也有影响.分析结果仅对所采用的面积单元有效分析结果仅对所采用的面积单元有效,在在其他尺度上无效其他尺度上无效,因此将某一尺度上的结因此将某一尺度上的结果推广到其他尺度上将导致生态缪误果推广到其他尺度上将导致生态缪误.空间数
21、据的不确定性空间数据的不确定性 空间数据的质量对建模分析,表示空间数据的质量对建模分析,表示,结果及结果及决策的正确性意义重大决策的正确性意义重大.空间数据使用者主要依赖二次数据源空间数据使用者主要依赖二次数据源,且且记录的时间误差也隐含在数据集中记录的时间误差也隐含在数据集中,空间数据空间数据的不确定性取决于误差结构随着地图上位置的不确定性取决于误差结构随着地图上位置的而变化的而变化.如遥感数据虽然经过几何校正如遥感数据虽然经过几何校正,但但位置误差还是不均匀的位置误差还是不均匀的.明确不确定性的类型明确不确定性的类型,来源及产生机制对来源及产生机制对提高空间数据质量提高空间数据质量,建立控
22、制与修正机制意建立控制与修正机制意义重大义重大.1.不确定性的类型不确定性的类型1.1空间不确定性空间不确定性 这种不确定性是由对象定义的主观性引起这种不确定性是由对象定义的主观性引起的的,如不清晰的边界如不清晰的边界,空间对象的属性具有主空间对象的属性具有主观性观性.1.2对象定义的不确定性对象定义的不确定性 对象定义依赖于人为规定对象定义依赖于人为规定1.3关系不确定性关系不确定性 生物量与测树因子的关系生物量与测树因子的关系1.4分区问题分区问题 气候类型区的划分气候类型区的划分,很多专家意见不一很多专家意见不一.2地理现象测度的不确定性地理现象测度的不确定性2.1物理测量误差物理测量误
23、差(高山海拔测量高山海拔测量)2.2数字化误差数字化误差2.3不同来源数据集整合时的误差不同来源数据集整合时的误差3地理对象表示的不确定性地理对象表示的不确定性3.1栅格数据表示的不确定性栅格数据表示的不确定性 栅格数据将空间划分为等面积的单元格栅格数据将空间划分为等面积的单元格(像素像素),一个单元格不完全是一个属性构成一个单元格不完全是一个属性构成,而包含了某几个属性而包含了某几个属性,这样的单元格为混合这样的单元格为混合元元,但一个单元格只能有一个值但一个单元格只能有一个值,这样混合元这样混合元的值为其优势值或中心点值的值为其优势值或中心点值.这样就会丢失某些信息这样就会丢失某些信息,使
24、栅格数据结构扭曲使栅格数据结构扭曲空间对象的形状空间对象的形状.3.2矢量数据表示的不确定性矢量数据表示的不确定性(数据聚集引起数据聚集引起)探索性空间数据分析与可视化探索性空间数据分析与可视化1.EDA ESDA与可视化与可视化 EDA技术的特点是数据不做假设技术的特点是数据不做假设,而是而是利用统计图表利用统计图表,图形和统计概括方法对数据图形和统计概括方法对数据特征进行分析与描述特征进行分析与描述,从而对数据进行更为从而对数据进行更为复杂的建模分析复杂的建模分析.ESDA技术是技术是EDA的推广的推广,空间数据存空间数据存在自相关性在自相关性,使数据无法满足独立性假设使数据无法满足独立性
25、假设.1.1EDA 与可视化基本方法与可视化基本方法包括两种类型包括两种类型:1)计算计算EDA,2)图形图形EDA技术技术1.1.1箱线图箱线图 属性数据表不能反映总体特征属性数据表不能反映总体特征,分布特征与分布特征与相互之间关系相互之间关系,需要通过统计方法集中反映数需要通过统计方法集中反映数据集中性据集中性,分散性分散性,偏态性偏态性,异常性等异常性等.箱线图是箱线图是反映属性数据这些特征的常用方法反映属性数据这些特征的常用方法.1)中位数与分位数中位数与分位数某一变量的某一变量的n个记录为个记录为:数据的值从小到大进行排序数据的值从小到大进行排序中位数是从小到大排列数据中位于中间位置
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 空间 数据 分析 解析 只是 课件
限制150内