空间数据的采集和质量控制.ppt
空间数据的采集和质量控制现在学习的是第1页,共57页第第1节节 概述概述 第第2节节 空间数据的地理参照系和控制基础空间数据的地理参照系和控制基础第第3节节 地理实体数据的编码地理实体数据的编码第第4节节 空间数据的采集空间数据的采集第第5节节 GIS的数据质量的数据质量第第6节节 空间数据标准空间数据标准第第 三三 章章 空间数据的采集和质量控制空间数据的采集和质量控制 教学要求教学要求 教学重点教学重点 教学活动教学活动 作作 业业现在学习的是第2页,共57页教学要求 1.理解地理空间的地理参照系和控制基础。理解地理空间的地理参照系和控制基础。2.掌握空间数据组织与编码方法。掌握空间数据组织与编码方法。3.了解空间数据和属性数据的采集和集成方法。了解空间数据和属性数据的采集和集成方法。4.理解空间数据的质量问题。理解空间数据的质量问题。教学重点 1.空间数据控制基础空间数据控制基础 2.空间实体组织和编码方法空间实体组织和编码方法 3.空间数据的采集和质量控制空间数据的采集和质量控制 教学活动 在学校图书馆或网络上查阅相关的地理信在学校图书馆或网络上查阅相关的地理信 息系统教材和杂志息系统教材和杂志,进一步理解空间数据组进一步理解空间数据组 织、编码、采集和质量控制的相关问题。织、编码、采集和质量控制的相关问题。现在学习的是第3页,共57页第第1节节 概概 述述一、一、GIS的数据源的数据源 统计数据文本数据地图数据存储介质、现势性、投影转换遥感、航空影象和数据分辨率、变形规律、纠正、解译特征实测数据数字数据格式、精度多媒体,辅助GIS空间分析和查询GIS空间数据现在学习的是第4页,共57页第第1节节 概概 述述二、空间数据采集的主要任务空间数据采集的主要任务 将现有的地图、外业观测成果、航空像片、遥感图象、将现有的地图、外业观测成果、航空像片、遥感图象、文本资料等转换成文本资料等转换成GISGIS可以处理与接收的数字形式,可以处理与接收的数字形式,通常需要经过验证、修改、编辑等处理。通常需要经过验证、修改、编辑等处理。现在学习的是第5页,共57页第第1节节 概概 述述三、研究三、研究GIS数据质量的目的和意义数据质量的目的和意义 1.什么是什么是GIS的数据质量的数据质量 是指GIS中空间数据(几何数据和属性数据)的可靠性,通常用空间数据的误差来 度量。误差是指数据与真值的偏离。2.GIS数据质量研究的目的数据质量研究的目的建立一套空间数据的分析和处理的体系,包括误差源的确定、误差的鉴别和度 量方法、误差传播的模型、控制和削弱误差的方法等,使未来的GIS在提供产品 的同时,附带提供产品的质量指标,即建立GIS产品的合格证制度。3.研究研究GIS数据质量的意义数据质量的意义 研究GIS数据质量对于评定GIS的算法、减少GIS设计与开发的盲目性都具有重 要意义。如果不考虑GIS的数据质量,那么当用户发现GIS的结论与实际的地理 状况相差较大时,GIS会失去信誉。现在学习的是第6页,共57页第第2节节 空间数据的地理参照系和控制基础空间数据的地理参照系和控制基础一、地理空间的数学建构一、地理空间的数学建构如何建立地球表面的几何模型 1)地球表面形态)地球表面形态最自然的地球表面最自然的地球表面 包括海洋底部、高山、高原在内的固体地球表面,难以用一个简洁的数学式描述。2)相对抽象的面)相对抽象的面大地水准面大地水准面 假设一个当海水处于完全静止的平衡状态时从海平面延伸到所有大陆下部,而与 地球重力方向处处正交的一个连续、闭合的水准面。与重力方向垂直的大地水准面不可能是一个十分规则的表面,且不能用简单的数 学公式来表达,大地水准面不能作为测量成果的计算面。铅垂线地球表面水准面大地水准面地球椭球体现在学习的是第7页,共57页第第2节节 空间数据的地理参照系和控制基础空间数据的地理参照系和控制基础一、地理空间的数学建构一、地理空间的数学建构如何建立地球表面的几何模型 3)地球椭球体模型)地球椭球体模型 为了测量成果计算的需要,选用一个同大地球体相近的、可以用数学方法来 表达的旋转椭球来代替地球三轴椭球体。ab c1952年前采用的海福特椭球1953年起改用克拉索夫斯基椭球1978年后开始采用1975年国际椭球,并以此建立了我国新的、独立的大地坐标系(大地原点在陕西径阳县永乐镇)a=6378140.0000000000mb=6356755.2881575287mf=(a-b)/a=1/298.257现在学习的是第8页,共57页第第2节节 空间数据的地理参照系和控制基础空间数据的地理参照系和控制基础二、地理参照系二、地理参照系平面系统平面系统 坐标系确定地面点或空间目标位置所采用的参考系。与测量相关的主要有地理坐标系和平面坐标系。地理坐标系直接建立在球体上的地理坐标,用经度和纬度表达地理对象位置。对空间定位有利,但难以进行距离、方向、面积量算。笛卡儿平面坐标系建立在平面上的直角坐标系统,用(x,y)表达地理对象位置。便于量算和进一步的空间数据处理和分析。xy现在学习的是第9页,共57页第2节 空间数据的地理参照系和控制基础二、地理参照系高程系统 坐标系确定地面点或空间目标位置所采用的参考系。与测量相关的主要有地理坐标系和平面坐标系。高程系统描述空间点在垂直高度上的特性 高程由高程基准面起算的地面点的高度。1956年黄海高程系1985年国家高程基准在采用新的高程基准后,对已有地图的等高线高程的影响可忽略不计现在学习的是第10页,共57页第2节 空间数据的地理参照系和控制基础三、GIS的地理控制基础 各种GIS的数据源、服务目的和各自特征可以不同,但均有自身统一的地理控制基础 1)地理控制基础的内容地理控制基础是地理信息数据表示格式与规范的重要组成部分统一的地图投影系统统一的地理格网坐标系统(地理参照系)统一的地理编码系统2)投影与坐标系:每一种投影都与一个坐标系统相联系。投影关系着如何将图形物体显示于平面上,坐标系统显示出地形地物所在的相对位置。3)统一的地图投影系统的意义:为地理信息的输入、输出及匹配处理提供一个统一的定位框架 使各种来源的地理信息和数据能够具有共同的地理空间基础现在学习的是第11页,共57页第2节 空间数据的地理参照系和控制基础四、地图投影 1)地图投影的概念及目的将地球椭球面上的点映射到平面上的方法,称为地图投影地理坐标为球面坐标,不方便进行距离、方位、面积等参数的量算地球椭球体为不可展曲面地图为平面,符合视觉心理,并易于进行距离、方位、面积等量算和各种空间分析 现在学习的是第12页,共57页第2节 空间数据的地理参照系和控制基础四、地图投影 2)地图投影的实质 建立地球椭球面上经纬线网和平面上相应经纬线网的数学基础,也就是建立地球椭球面上的点的地理坐标(,)与平面上对应点的平面坐标(x,y)之间的函数关系:当给定不同的具体条件时,将得到不同类型的投影方式。现在学习的是第13页,共57页第2节 空间数据的地理参照系和控制基础四、地图投影 3)地图投影变形将不可展的地球椭球面展开成平面,并且不能有断裂,则图形必将在某些地方被拉伸,某些地方被压缩,故投影变形是不可避免的。长度变形面积变形角度变形现在学习的是第14页,共57页第2节 空间数据的地理参照系和控制基础四、地图投影 4)地图投影方法 变形分类:等角投影:投影前后角度不变 等面积投影:投影前后面积不变;任意投影:角度、面积、长度均变形 投影面:横圆柱投影:投影面为横圆柱 圆锥投影:投影面为圆锥 方位投影:投影面为平面 投影面位置:正轴投影:投影面中心轴与地轴相互重合 斜轴投影:投影面中心轴与地轴斜向相交 横轴投影:投影面中心轴与地轴相互垂直 相切投影:投影面与椭球体相切 相割投影:投影面与椭球体相割现在学习的是第15页,共57页第2节 空间数据的地理参照系和控制基础四、地图投影 5)GIS与地图投影的关系数据输出(具有相应投影的地图)数据获取(不同投影的地图)数据标准化预处理(按某一参照系数字化)数据存储(统一的坐标基础)数据处理(投影转换)数据应用(检索查询、覆盖分析等)地理基础(地图投影)现在学习的是第16页,共57页第2节 空间数据的地理参照系和控制基础四、地图投影 5)GIS与地图投影的关系GIS以地图方式显示地理信息,而地图是平面,地理信息则在地球椭球上,因此地图投影在GIS中不可缺少。GIS数据库中地理数据以地理坐标存储时,则以地图为数据源的空间数据必须 通过投影变换转换成地理坐标;而输出或显示时,则要将地理坐标表示的空 间数据通过投影变换变换成指定投影的平面坐标。GIS中,地理数据的显示可根据用户的需要而指定投影方式,但当所显示的地 图与国家基本地图系列的比例尺一致时,一般采用国家基本系列地图所用的 投影。现在学习的是第17页,共57页第2节 空间数据的地理参照系和控制基础四、地图投影 6)GIS中地图投影的设计与配置一般原则 与相应比例尺的国家基本图投影系统一致。系统一般只考虑至多采用两种投影系统,一种应用于大比例尺的数据处理 与输出、输入,另一种服务于小比例尺。所用投影以等角投影为宜。所用投影应能与网格坐标系统相适应,即所采用的网格系统在投影带中 应保持完整。现在学习的是第18页,共57页第2节 空间数据的地理参照系和控制基础四、地图投影 7)我国常用的地图投影配置 我国基本比例尺地形图(1:100万到1:5000),除1:100万外均采用高斯克 吕格投影 为地理基础;我国1:100万地形图采用了Lambert投影,其分幅原则与国际地理学会规定的全球 统一使用的国际百万分之一地图投影保持一致。我国大部分省区图以及大多数这一比例尺的地图也多采用Lambert投影和属于同 一投影系统的Albers投影(正轴等面积割圆锥投影);Lambert投影中,地球表面上两点间的最短距离(即大圆航线)表现为近于直线。现在学习的是第19页,共57页第3节 地理实体数据的编码一、属性数据的定义 地理实体数据的编码指的是地理实体中属性数据的编码 1、属性数据的含义是指描述实体数据的属性特征的数据 如道路的宽度、等级、表面类型、建筑方法、建筑日期、特殊的交通规则、车流量等 当属性数据的数据量较大时,通常与几何数据分开输入,并存储在数据库 中,通过惟一的标识符与相应的几何数据联系起来 在属性数据中,有一部分是与几何数据的表示密切有关的(如道路的等级、类型等,它们决定着道路符号的形状、色彩、尺寸等),在G1S中,通常把 这部分属性数据用编码的形式表示,并与几何数据一起管理起来。编码的过程是将信息转换成数据的过程,前提是首先要对需表示的信息进行分类分级现在学习的是第20页,共57页第3节 地理实体数据的编码二、属性数据的分类分级 分类,是将具有共同的属性或特征的事物或现象归并在一起,而把不同属性或特征的事物或现象分开的过程 分级,对事物或现象的数量或特征进行等级的划分,主要包括确定分级数和分级界线。1、分类的基本原则 分类的基本原则是:科学性 选择事物或现象最稳定的属性和特征作为分类的依据。系统性 应形成一个分类体系,低级的类应能归并到高级的类中。可扩性 应能容纳新增加的事物和现象,而不至于打乱已建立的分类系统。实用性 应考虑对信息分类所依据的属性或特征的获取方式和获取能力。兼容性 应与有关的标准协调一致。现在学习的是第21页,共57页第3节 地理实体数据的编码二、属性数据的分类分级2、分类的基本方法 线分类法(层次分类法)面分类法 线分类法将初始的分类对象按所选定的若干个属性或特征依次分成若干个层级 目录,并编排成一个有层次的、逐级展开的分类体系。其中,同层级类目之间存在并列关系,不同层级类目之间存在隶属关系,同层类目互不重复、互不交叉。优点:容量较大,层次性好,使用方便;缺点:分类结构一经确定,不易改动,分类层次较多时,代码位数较长。面分类法将给定的分类对象按选定的若干个属性或特征分成彼此互不依赖、互不 相干的若干方面(简称面),每个面中又可分成许多彼此独立的若干个类 目。该的分类结果在应用时,可根据需要将面中的类目组合在一起,形成复合类目 优点:是具有较大的弹性,一个面内类目的改变,不会影响其他面,且适应性强,易于添加和修改类目 缺点:是不能充分利用容量。现在学习的是第22页,共57页第3节 地理实体数据的编码二、属性数据的分类分级 3、分级的基本原则 分级数应符合数值估计精度的要求 分级数多,数值估计的精度就高。分级数应顾及可视化的效果 等级的划分要以图形的方式表示出来,根据人对符号等级的感受,分级数应在47级。分级数应符合数据的分布特征 对于呈明显聚群分布的数据,应以数据的聚群数作为分级数。在满足精度的前提下,应尽可能选择较少的分级数 现在学习的是第23页,共57页第3节 地理实体数据的编码二、属性数据的分类分级 4、确定分级界线的基本原则 保持数据的分布特征 使级内差异尽可能小,各级代表值之间的差异应尽可能大。在任何一个等级内都必须有数据,任何数据都必须落在某一个等级内 尽可能采用有规则变化的分级界线 分级界线应当凑整现在学习的是第24页,共57页第3节 地理实体数据的编码二、属性数据的分类分级 5、分级的基本方法 在分级时,大多采用数学方法,如数列分级、最优分割分级等 对于有统一的标准的分级方法时,应采用标准的分级方法 如按人口数把城市分为特大城市、大城市、中等城市、小城市等 也可以定性地分级,如国家、省、市、县、镇等现在学习的是第25页,共57页第3节 地理实体数据的编码三、属性数据的编码确定属性数据代码的方法和过程 代码,是一个或一组有序的易于被计算机或人识别与处理的符号,是计算机鉴别和查找信息的主要依据和手段。编码的直接产物就是代码,而分类分级则是编码的基础。1、代码的功能 鉴别 代码代表对象的名称,是鉴别对象的惟一标识。分类 当按对象的属性分类并分别赋予不同的类别代码时,代码又可作为区分分类对象类别的标识。排序 当按对象产生的时间、所占的空间或其他方面的顺序关系排列 并分别赋予不同的代码时,代码又可作为区别对象排序的标识。现在学习的是第26页,共57页第3节 地理实体数据的编码三、属性数据的编码确定属性数据代码的方法和过程 2、编码的基本原则 惟一性 一个代码只惟一地表示一类对象。合理性 代码结构要与分类体系相适应。可扩性 必须留有足够的备用代码,以适应扩充的需要。简单性 结构应尽量简单,长度应尽量短。适用性 代码应尽可能反映对象的特点,以助记忆。规范性 代码的结构、类型、编写格式必须统一。现在学习的是第27页,共57页第3节 地理实体数据的编码三、属性数据的编码确定属性数据代码的方法和过程 3、代码的类型是指代码符号的表示形式,有数字型、字母型、数字和字母混合型三类 数字型代码,是用一个或若干个阿拉伯数字表示对象的代码。特点:结构简单、使用方便、易于排序,但对对象的特征描述不直观 字母型代码,是用一个或若干个字母表示对象的代码。特点:比同样位数的数字型代码容量大,还可提供便于识别的信息,易于记忆,但比同样位数的数字型代码占用更多的计算机空间。数字、字母混合型代码,是由数字、字母、专用符组成的代码。特点:代码兼有数字型和字母型的优点,结构严密,直观性好,但组成形式复杂,处理麻烦。现在学习的是第28页,共57页第3节 地理实体数据的编码三、属性数据的编码确定属性数据代码的方法和过程 4、GIS中代码的种类可以分为两种,一种是分类码,另一种是标识码。分类码,是根据地理信息分类体系设计出的各专业信息的分类代码,用以 标识不同类别的数据,根据它可以从数据中查询出所需类别的 全部数据。标识码(亦称识别码),是在分类码的基础上,对每类数据设计出其全部或主 要实体的识别代码,用以对某一类数据中的某个实体(如一个居民 地、一条河流等)进行个体查询检索,从而弥补分类码不能进行个体 分离的缺陷。标识码是联系实体的几何信息和属性信息的关键字。现在学习的是第29页,共57页第3节 地理实体数据的编码三、属性数据的编码确定属性数据代码的方法和过程 5、编码方法举例 行政区划代码(GB226091)是一种识别码 用 6 位数字代码按层次分别表示:例如,南京市的代码为320101 连云港市的代码为320701 东海县320722 灌云县320723 赣榆县320721 灌南县320822现在学习的是第30页,共57页三、属性数据的编码确定属性数据代码的方法和过程 5、编码方法举例 加拿大数字地形要素分类编码系统一种分类码,且是数字字母混合代码 采用树型结构将地形要素分为四级,其代码结构为:X X X X X X X X X 四级代码,三位数字 三级代码,三位数字 二级代码,两位数字 一级代码,一位数字第3节 地理实体数据的编码现在学习的是第31页,共57页属性数据的编码编码方法层次分类编码法:是按照分类对象的从属和层次关系为排列顺序的一种代码,它的优点是能明确表示出分类对象的类别,代码结构有严格的隶属关系。耕地71园地 72林地 73牧草地74居民点及公矿用地 75交通用地75水域 76未利用地 77土地利用类型7有林地 731灌木地 732疏林地733迹地 735针叶树疏林地7331阔叶树疏林地7332未成林林地734现在学习的是第32页,共57页多源分类编码法:对于一个特定的分类目标,根据诸多不同的分类依据分别进行编码,各位数字代码之间并没有隶属关系。标 志 编 号分 类123平原河过渡河山地河123常年河时令河消失河12通航河不通航河123456树状河平行河筛状河辐射河扇形河迷宫河1234567主要河流一级支 流二级 三级 四级 五级 六级 七级12345河长:一组 1公里以下 二组 2公里以下 三组 5公里以下 四组10公里以下 五组10公里以上12345678河宽:一组 510 米 二组 1020 米 三组 2030 米 四组 3060 米 五组 60120米 六组120300米 七组300500米 八组500米以上1234567河流间的最短距离50米 50 100 米100 200 米200 400 米400 500 米500 1000米10002000米12345弯曲度:2.5公里弯曲 深度 宽度 40 50 50 40 50 75 25 50 75 25 50 100 75 150现在学习的是第33页,共57页 GIS的核心是地理数据库 GIS的数据采集就是将空间实体的几何数据和属性数据输入到地理数据库中 这是建立GIS的第一步 GIS需要输入两方面的数据:几何数据 属性数据 而拓扑数据可在已有的几何数据基础上重新建立 GIS地理数据库的建立需进行三方面的工作:几何数据的采集 属性数据的采集 几何数据与属性数据的连接第4节 空间数据的采集现在学习的是第34页,共57页一、地理目标数据的分层 地理目标数据,可按某种属性特征形成一个数据层,通常称为图层。图层,是描述某一地理区域的某一(有时也可以是多个)属性特征的数据集。某一区域的地理目标数据可以看成是若干图层的集合。分层的目的 是为了便于空间数据的 管理对所有地理目标的管理就简化为对各数据层的管理。查询对地理目标数据进行查询,只需要对某一层地理目标数据进行 查询即可,因而可加快查询速度。显示不需要分层后的地理目标数据由于任意选择需要显示的图层,因而增加了图形显示的灵活性 分析对不同数据层进行叠加,可进行各种目的的空间分析 第4节 空间数据的采集现在学习的是第35页,共57页一、地理目标数据的分层 分层的方法 A.按专题分层 每个图层对应一个专题,包含某一种或某一类数据。如地貌层、水系层、道路层等。对于不同的研究目的,地理目标数据可以根据不同的专题分成不同的数据层。B.按时间序列分层 把不同时间或不同时期的数据分别构成各个数据层。第4节 空间数据的采集现在学习的是第36页,共57页二、几何数据的采集 已有几何数据的转换及装载;实测几何数据的直接装载;扫描获取的栅格直接装载;遥感专题信息的提取 矢量数据的采集地图跟踪数字化,地图扫描数字化 第4节 空间数据的采集现在学习的是第37页,共57页二、几何数据的采集地图跟踪矢量化 地图跟踪数字化,是通过记录数字化板上点的平面坐标来获取矢量数据。基本过程是:将需数字化的图件(地图、航片等)固定在数字化板上,然后设定数字化范围、输入有关参数、设置特征码清单、选择数字化方式(点方式和流方式等),按地图要素的类别分别实施图形数字化了。地图跟踪数字化时数据的可靠性主要取决于:操作员的技术熟练程度,操作员的情绪 跟踪数字化本身几乎不需要GIS的其它计算功能,所以跟踪数字化软件往往可 以与整个GIS系统脱离开,可单独使用。第4节 空间数据的采集现在学习的是第38页,共57页二、几何数据的采集地图扫描矢量化 扫描数字化,是目前较为先进的地图数字化方式,也是今后的发展方向,但要实现完全自动化还要做大量艰苦工程 目前所能提供的扫描数字化软件是半自动化的,还需做相当一部分的人机交互工作。地图扫描数字化的基本思想是:首先通过扫描将地图转换为栅格数据,然后采用栅格数据矢量化的技术追踪出线和面,采用模式识别技术识别出点和注记,并根据地图内容和地图符号的关系,自动给矢量数据赋以属性值。第4节 空间数据的采集现在学习的是第39页,共57页三、属性数据的采集 属性数据的录人主要采用键盘输入的方法,有时也可以辅助于字符识别软件。当属性数据的数据量较小时,可以在输入几何数据的同时,用键盘输入;当数据量较大时,一般与几何数据分别输入,并检查无误后转人到数据库中。第4节 空间数据的采集现在学习的是第40页,共57页四、空间数据与属性数据的连接 实体几何数据与属性数据的连接纽带公共标识符(关键字)标识符可以在输入几何数据或属性数据时手工输人,也可以由系统自动生成(如用顺序号代表标识符)。当几何数据或属性数据没有公共标识码时,只有通过人机交互的方法,确定两者之间的关系,同时自动生成公共标识码。空间实体的几何数据与属性数据连接起来之后,就可进行各种GIS的操作与运算 不论是在几何数据与属性数据连接之前或之后,GIS都应提供灵活而方便的手段 以对属性数据进行增加、删除、修改等操作。第4节 空间数据的采集现在学习的是第41页,共57页五、空间数据的检核 1、空间数据输入的误差 (1)几何数据的不完整或重复;(2)几何数据的位置不正确;(3)比例尺不正确;(4)变形;(5)几何数据与属性数据的连接有误;(6)属性数据错误 第4节 空间数据的采集现在学习的是第42页,共57页五、空间数据的检核 2、空间数据的检查常见的检查方法 (1)通过图形实体与其属性的联合显示,发现数字化中的遗漏、重复、不匹配等错误;(2)在屏幕上用地图要素对应的符号显示数字化的结果,对照原图检查错误;(3)把数字化的结果绘图输出在透明材料上,然后与原图叠加以便发现错漏;(4)通过确定最低和最高等高线的高程及等高距,编制软件来检查等高线高程赋值是否正确;(5)对于面状要素,可在建立拓扑关系时,根据多边形是否闭合来检查,或根据多边形与多边形内点的匹配来检查等;(6)对于属性数据,通常是在屏幕上逐表、逐行检查,也可打印出来检查;(7)对于属性数据还可编写检核程序,如有无字符代替了数字,数字是否超出范围等;(8)对于图纸变形引起的误差,应使用几何纠正进行处理。第4节 空间数据的采集现在学习的是第43页,共57页六、图形数据采集、入库之前的预处理 (1)几何纠正 纠正由纸张变形所引起的数字化数据的误差,直接关系到GIS数据的质量。几何纠正要以控制点的理论坐标和数字化坐标为依据来进行,最后应显示平差结果。(2)投影变换 为保证GIS地理数据库中空间数据的一致性,须将原图投影下的矢量数据转换为地理坐标或指定投影下的数据。(3)图形接边 在相邻地图的接合处可能会产生裂隙。包括几何裂隙和属性裂隙。在自动接边无法处理时,需要人机交互进行。(4)图形编辑 图形编辑功能应能对点、线、面进行增加、删除、移动、修改等 (5)拓扑关系的建立 拓扑关系是强大的查询与分析功能的基础。建立拓扑是在已矢量化的数据的基础上,自动建立起点、线、面的拓扑关系。第4节 空间数据的采集现在学习的是第44页,共57页第5节 GIS的数据质量一、GIS数据质量的内容和类型 1.GIS数据质量的基本内容 GIS数据质量包含如下五个方面:位置精度:如数学基础、平面精度、高程精度等,用以描述几何数据的质量。属性精度:如要素分类的正确性、属性编码的正确性、注记的正确性等,用以反映属性 数据的质量。逻辑一致性:如多边形的闭合精度、结点匹配精度、拓扑关系的正确性等。完备性:如数据分类的完备性、实体类型的完备性、属性数据的完备性、注记的完整性等 现势性:如数据的采集时间、数据的更新时间等 2.误差产生的主要原因 空间现象自身存在的不稳定性 空间现象的表达(如由椭球体到平面必然产生误差)空间数据处理中的误差 空间数据使用中的误差 现在学习的是第45页,共57页第5节 GIS的数据质量一、GIS数据质量的内容和类型 3.空间数据的误差类型GIS空间数据的误差可分为源误差和处理误差:(1)源误差,是指数据采集和录入中产生的误差,包括:遥感数据:摄影平台、传感器的结构及稳定性、分辩率等 测量数据:人差(读数误差等)、仪差(仪器不完善等)、环境(干扰等)属性数据:数据的录入、数据库的操作等 GPS数据:信号的精度、接收机精度、定位方法、处理算法等 地图:控制点精度,编绘、清绘、制图综合等的精度 地图数字化精度:纸张变形、数字化仪精度、操作员的技能等 (2)处理误差,是指GIS对空间数据进行处理时产生的误差,如:几何纠正;坐标变换;几何数据的编辑;属性数据的编辑;空间分析(如多边形叠置等);图形化简(如数据压缩);数据格式转换;计算机截断误差;空间内插;矢量栅格数据的相互转换。现在学习的是第46页,共57页第5节 GIS的数据质量一、GIS数据质量的内容和类型 4.GIS中的误差传播 误差传播是指对有误差的数据,经过处理生成的GIS产品也存在着误差。误差传播公式:误差传播在GIS中可归结为三种方式:1 代数关系下的误差传播:是指对有误差的数据进行代数运算后,所得结果的误差。2 逻辑关系下的误差传播:即指在GIS中对数据进行逻辑交、并等运算所引起的误差传 播,如叠置分析时的误差传播。3 推理关系下的误差传播:是指不精确推理所造成的误差。y=F(x1,x2,xn)xi:空间数据子变量,带有误差 F:为GIS空间数据操作过程中的函数关系式现在学习的是第47页,共57页第5节 GIS的数据质量二、研究GIS数据质量的方法 1.GIS数据质量的评价方法直接评价法1用计算机程序自动检测某些类型的错误可以用计算机软件自动发现,数据中不符合要求的数据项的百分率或 平均质量等级也可由计算机软件算出。如可以检测编码是否正确等。2随机抽样检测在确定抽样方案时,应考虑数据的空间相关性间接评价法(地理相关法和元数据法),是指通过外部知识或信息进行推理来确定空间数据的质量的方法。用于推理的外部知识或信息如用途、数据历史记录、数据源的质量、数据生产的方 法、误差传递模型等。非定量描述法,是指通过对数据质量的各组成部分的评价结果进行的综合分析来确定 数据的总体质量的方法。现在学习的是第48页,共57页第5节 GIS的数据质量二、研究GIS数据质量的方法 2.研究GIS数据质量的常用方法 敏感度分析法,通过人为地在输入数据中加上扰动值来检验输出结果对这些扰动值的敏感 程度。然后根据适合度分析,由置信域来衡量由输入数据的误差所引起的 输出数据的变化。敏感度分析法是一种间接测定GIS产品可靠性的方法。尺度不变空间分析法,地理数据的分析结果应与所采用的空间坐标系统无关,即为尺度 不变空间分析,包括比例不变和平移不变。尺度不变是数理统计中常用的 一个准则,一方面在能保证用不同的方法能得到一致的结果,另一方面又 可在同一尺度下合理地衡量估值的精度。Monte Carlo实验仿真,首先根据经验对数据误差的种类和分布模式进行假设,然后利用 计算机进行模拟试验,将所得结果与实际结果进行比较,找出与实际结果 最接近的模型。空间滤波,可从含有噪声的数据中分离出噪声信息或者从含有噪声的数据中提取信号,然后用随机过程理论等方法求得数据的误差。对GIS数据质量的研究,传统的概率论和数理统计是其最基本的理论基础,同时还需要信息论、模糊逻辑、人工智能、数学规划、随机过程、分形几何等理论与方法的支持。现在学习的是第49页,共57页第5节 GIS的数据质量三、数据采集中的数据质量评价 GIS中数据采集的方法:直接方法直接从野外采集,以获取观测数据、图象等 受人、仪器和环境影响,但已有传统方法可解决 间接方法从已有的图件上进行采集 除受直接方法中误差影响外,还有展绘控制点误差、编绘误差、制图综合 误差、数字化误差等 地图数字化是获取矢量数据的主要方法之一,也是GIS的重要误差源,是GIS数据质量研究的重点。地图数字化中,原图固有误差和数字化过程中引入的误差是两个主要的误差源 现在学习的是第50页,共57页第5节 GIS的数据质量三、数据采集中的数据质量评价 A.地图固有误差的来源和类型 除了含有控制点和碎部点引入误差外,还至少存在下列误差:控制点展绘误差 编绘误差 绘图误差 综合误差 地图复制误差和分版套合误差 绘图材料变形误差 特征的定义误差 展绘控制点是成图的第一步。当地图的精度要求不高时,该误差可不考虑通常点状特征的编绘精度优于线状特征的编绘精度,即使是线状特征,分辨率和宽度不同,编绘精度也不同绘图过程中产生的,其误差范围为0.060.18mm其大小取决于特征的类型和复杂程度,有取决于采用的制图综合方法,如取舍、夸大等,因此,综合误差极难量化地图印刷中产生的误差,如地图复制误差的均方差为0.10.2mm环境条件变化,地图图纸也会发生变化自然界的许多特征并无明确的界限,但在地图上却有明确的位置现在学习的是第51页,共57页第5节 GIS的数据质量三、数据采集中的数据质量评价 B.数字化误差的评价方法 数字化的精度主要受数字化仪、数字化的方式、操作员的水平、数字化软件的算法等影响。1)评价数字化误差的方法 自动回归法,由于跟踪数字化的数据是一个随机序列,存在序列相关性,同时还是一个时间序列,因此可用数理统计中的时间序列分析法来确定数字化的误差。Band法,又称误差带方法,即在一条数字化线的两侧,各定义宽为的范围,作为 该数字化线的误差带,用的值来说明误差的范围,以及处理多边形叠置等 的误差。该方法适用于任何类型的GIS数据,关键是如何给出合理的值。对比法,把数字化后的数据,用绘图机绘出,与原图叠合,选择明显地物点进行量测,以确定误差。除了几何精度外,属性精度、完整性、逻辑一致性等也可用对比 法进行对照检查。现在学习的是第52页,共57页第5节 GIS的数据质量三、数据采集中的数据质量评价 B.数字化误差的评价方法 数字化的精度主要受数字化仪、数字化的方式、操作员的水平、数字化软件的算法等影响。2)数字化过程中的质量控制 数字化预处理工作包括对原始地图、表格等的整理、清绘。数字化设备的选用根据手扶数字化仪、扫描仪等设备的分辨率和精度等有关参数的进行挑选,这些参数不应低于设计的数据精度要求。数字化对点精度(准确性)数字化时数据采集点与原始点的重合程度,一般要求对点误差小于0.1mm。数字化限差包括:采点密度(0.2mm)、接边误差(0.02mm)、接合距离(0.02mm)、悬挂距离(0.007mm)等。数据的精度检查输出图与原始图之间的点位误差,一般要求对直线地物和独立地物,误差小于0.2mm,对曲线地物和水系,误差小于0.3mm,对边界模糊的要素应小于0.5mm现在学习的是第53页,共57页第5节 GIS的数据质量四、数据处理中的数据质量评价 数字高程模型(DEM)的精度 原始资料的精度 影响因素:内插的精度 DEM精度的评价方法:原始等高线与再生等高线叠合评价的方法。原始等高线DEM重新生成等高线原始等高线与 重新生成等高线叠加内插自动追踪现在学习的是第54页,共57页第5节 GIS的数据质量四、数据处理中的数据质量评价 矢量数据栅格化的误差 属性误差:像元越大,属性误差越大。几何误差:几何误差的大小与象元的大小成正比。其中矢量数据表示的多边形用像元逼近时会产生较严重的拓扑匹配问题。误差分析的一种方法:假设存在一幅理想的矢量地图,图上不同属性的制图单元由很细的线分开;对理想地图进 行观测采样得到一幅具有规则格网的栅格地图,把这两幅图进行叠置比较。理想地图是根本不存在的,但在这一假设下,可以提供一种仅利用栅格地图本身来估算矢 量数据栅格化的精度的方法。B B A AABC现在学习的是第55页,共57页第5节 GIS的数据质量四、数据处理中的数据质量评价 多边形叠置产生的误差 包括:拓扑匹配误差、几何误差和属性误差 拓扑匹配误差 叠置的多边形的边界越精确,越容易产生无意义的多边形。多边形叠置所形成的多边形的数量与原多边形边界的复杂程度有关。合并无意义的多边形 A、用人机交互的方法把无意义的多边形合并到大多边形中;B、根据无意义多边形的临界值,自动合并到大多边形中;C、用拟合后的新边界进行合并。现在学习的是第56页,共57页第5节 GIS的数据质量 五、空间数据质量控制常见的方法 传统的手工方法 将数字化数据与数据源进行比较,图形部分的检查包括目视方法、绘制到透明图上与 原图叠加比较,属性部分的检查采用与原属性逐个对比或其他比较方法 元数据方法 数据集的元数据中包含了大量有关数据质量的信息,通过它可以检查数据质量,同时元数据也记录了数据处理过程中质量的变化,通过跟踪元数据可以了解数据质量 的状况和变化 地理相关法 用空间数据的地理特征要素自身的相关性来分析数据的质量。现在学习的是第57页,共57页