《空间数据库中数据质量控制的方法与措施(共6页).doc》由会员分享,可在线阅读,更多相关《空间数据库中数据质量控制的方法与措施(共6页).doc(6页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上空间数据质量特性与质量控制范志坚1,2,方源敏1,汪虹2(1.昆明理工大学国土资源工程学院 昆明 ;2.云南省基础地理信息中心 昆明 )摘要:本文主要讨论空间数据质量特性、质量控制所涉及的内容。结合笔者最近从事空间数据库建库的具体实践和工作体会,探讨从位置精度、属性精度、时间精度、数据完整性和逻辑一致性等方面对数据质量进行全面控制,最终建成一个质量可靠的空间数据库。关键词:地理信息系统;空间数据库;空间数据;质量特性;质量控制 Quality characteristic and Quality control of Spatial dataFan Zhi-jian1
2、,2,Fang Yuan-min1,Wang-Hong2(1.Faculty of Land Resources Engineering,Kunming University of Science and Technology,Kunming,China;2.Yunnan Provincial Geomatics center,Kunming ,China)Abstract:This paper mainly talks over contents which are involved with quality characteristic and quality control of spa
3、tial dataIntegrating with concrete practice and work experience which the writer has recently been engaged in establishing spatial database,a very comprehensive control of data quality should be discussed from aspects of positional accuracy、attribute accuracy、temporal accuracy、data compression、as we
4、ll as logic conformance and so onFinally,a dependable spatial database should be set upKey words:GIS;spatial database;spatial data;quality characteristic;quality control0 引言空间数据库是随着地理信息系统(GIS)的开发和应用而发展起来的数据库新技术,它是地理信息系统的重要组成部份,是地理信息系统应用部份的前题和基础。空间数据库为此建立了如实体、关系、数据独立性、完整性、数据操作、资源共享等一系列基本概念。以空间数据存储和操作
5、为对象的空间数据库,把被管理的数据从一维推向了二维、三维甚至更高维。空间数据库是一种应用于空间数据处理与信息分析领域的具有工程性质的数据库,它所管理的对象主要是空间实体。在空间数据库中,空间数据质量的好坏,直接影响到空间数据库的经济效益和社会效益。要得到高质量的空间数据,最重要的是在空间数据生产和使用过程中进行质量管理和质量控制。通过质量管理和质量控制,可以分析影响产品质量的原因,进而提高空间数据的质量。空间数据的质量是空间数据库生存和发展的保障,缺少质量指标的空间数据将无法得到用户的信任,且直接影响到地理信息系统应用、分析、决策的正确性和可靠性。由此可知,空间数据质量是空间数据库的生命线。1
6、 空间数据库中的误差空间数据库建立后,数据库中的误差包含了原始数据的误差和数据库建库所引入的误差。1.1 原始数据的误差原始数据是指空间数据库建设时所包含的基本的数字化数据。它未经过任何地理信息系统的分析处理。原始数据的误差可分为源误差、处理误差和应用误差等三种类型。源误差:源误差是指数据采集和录入中产生的误差。包括遥感数据、测量数据、属性记录、GPS数据、地图、地图数字化精度等的误差。处理误差:处理误差是指数据录入后进行空间数据处理过程中产生的误差。包括几何改正、坐标变换和比例变换、投影变换、几何数据的编辑、属性数据的编辑、空间分析(如多边形叠置、数据层叠加时的冗余多边形等)、图形化简(数据
7、压缩和曲线光滑)、数据格式转换、计算机裁切误差、空间内插、矢量栅格数据的相互转换等。使用误差:使用误差是指空间数据被使用过程中出现的误差。包括数据的完备程度、时间的有效性(即现势性)、拓扑关系的正确性、缺乏数据的质量报告、由应用模型引起的误差等。以上三种误差中,数据处理误差远远小于源误差,使用误差看来不属于数据本身的误差,但是这些因素直接影响到应用的效果,所以也应列为空间数据误差的范畴。1.2 空间数据库建库所引入的误差空间数据库中的多源数据,经过基础地理信息数据库系统管理平台的各种分析、处理后,可以形成新的数据和最后产品。在这个过程中还会产生新的误差,这些误差包括:计算误差、拓扑叠加分析引起
8、的数据误差以及GIS中的误差传播问题。计算误差:计算机能否按需要的精度存储和处理数据,主要取决于计算机字长。在计算机字长不够的情况下进行许多大数据的运算时,会出现较大的舍入误差。图形图像处理的算法选择也与计算误差相关。数据处理过程中引入的计算误差一般还是较小,特别是与数据源误差相比,此项误差是可以忽略不计的。拓扑叠加分析引起的数据误差:叠加分析是地理信息系统中很常用的一种分析方法。通过同一地区不同内容的多幅地图的叠加组合,产生新的图形和属性信息。在这个过程中,往往产生拓扑匹配、位置和属性方面的数据质量问题。由于叠加时,多边形的边界可能不完全重合,从而产生若干无意义的多边形。对这些无意义多边形进
9、行处理的结果往往会改变边界线的位置。叠加后形成的新的多边形,其属性值的确定也可能存在属性组合带来的误差。地理信息系统中的误差传播问题:地理信息系统中,由于从数据来源、空间数据库建立到空间数据库的操作和使用都引入了各种误差因素,特别是空间数据集成与整合所引入的误差。因此空间数据库系统应用分析的最终结果中也包含了这些误差因素的影响。误差传播的研究目的就是研究初始过程和中间过程中引入的误差因素对于最后结果的影响,并模拟误差的变化。目前,由于对地理信息系统误差传播机理的认识还不够深入,误差传播的很多方面都还处于研究和试验阶段。但是,对于地理信息系统的专业人士来说,了解数据的各类误差均会以某种方式在系统
10、中传播并将对地理信息系统的最后应用结果的质量产生影响,对理解地理信息系统数据、数据产品和空间数据库的可靠性将是十分有益的。以上讨论了空间数据库中原始数据本身含有的误差和随后空间数据库操作中引入的误差。一般来说,原始数据的误差远远大于空间数据库操作中引入的误差,因此,要想控制空间数据库的数据质量,数据获取生产过程中的质量控制及良好的入库空间数据是至关重要的。2 空间数据质量与评价2.1 空间数据质量空间数据是空间数据库中管理和处理的主要对象。空间数据是指用来表示空间实体的位置、形状、大小及其分布特征诸多方面信息的数据。它可以用来描述来自现实世界的目标,它具有定位、定性、时间和空间关系等特性。定位
11、是指在一个已知的坐标系里空间实体都具有唯一的空间位置;定性是指有关空间实体的自然属性,它伴随着实体的地理位置;时间是指空间目标随时间的变化而变化;空间关系通常又称拓扑关系,在数据库中的表示可以是显示的,也可以是隐式的。空间数据分矢量数据(DLG)和栅格数据,栅格数据又分为点阵式的影像数据(DOM、DRG)或格网数据(DEM)。空间数据(几何数据和属性数据)质量是指空间数据的可靠性和精度,通常用空间数据的误差来度量。空间数据的质量控制是针对空间数据的特点来进行的,主要包括数据完整性、数据逻辑一致性、位置精度、属性精度、时间精度以及一些关于数据的说明 。空间数据的质量控制就是通过采用科学的方法,制
12、定出空间数据的生产技术规程,并采取一系列切实有效的方法在空间数据的生产过程中,针对关键性问题予以精度控制和错误改正,以保证空间数据的质量。空间数据质量标准要素的具体内容为:空间数据的完整性主要是指数据是否覆盖到应该覆盖的范围,如全国的数据就应该覆盖到全国范围,一个省的居民地就应该包括全省的居民地数据;空间数据的逻辑一致性主要是指数据定义的统一性,在同一个基础地理信息数据库中,数据的定义应该保持一致;空间数据的位置精度主要是指数据的地理位置精度;空间数据的属性精度主要是指数据所载负的地理信息的正确性,比如同一线状地物的分类码赋值是否连续、合理,一条河流的名称及分级是否正确和一致,一个居民地的名称
13、及其行政隶属关系是否正确等等;空间数据的时间精度是数据本身所代表的时间信息的正确性,如50年代的湖泊数据与90年代的湖泊数据就有很大的差别;关于数据的说明称为元数据,是对基础地理信息数据源的注释,如数据种类、投影方式、平高系统、生产单位和时间等;空间数据表达形式的合理性是指数据抽象、数据表达与真实地理世界的吻合性,包括空间特征、专题特征和时间特征表达的合理性等。2.2 空间数据质量评价空间数据质量是众多影响因素共同作用的结果。因此质量评价模型的确立应充分考虑这些因素后确立其质量元素。按照数据质量评价方法的不同,空间数据质量评价可分为直接质量评价和间接质量评价。直接质量评价是对数据集通过全面检测
14、或抽样检测方式进行质量评价,又称验收度量;间接质量评价是通过对数据源、生产方法、数据处理等间接信息的检查方式进行数据集质量评价,又称预估度量。为了度量和描述方便起见,空间数据的质量按其元素可分为一级质量元素和二级质量元素。2.2.1 直接质量评价空间数据质量直接评价是通过表1规定的质量元素来评价的。表1空间数据质量元素一级质量元素二级质量元素基本要求文件名称、数据格式、数据组织数学精度数学基础、平面精度(DLG、DOM、DRG)、高程精度(DLG、DEM)、接边精度(DLG、DOM、DEM)、分版套合精度(DRG)、格网精度(DEM)图形或影像质量分辨率(DOM、DRG)、反差(DOM)、清晰
15、度(DOM、DRG)、灰度(DOM)、色彩一致性(DRG、DOM)、外观质量(DRG、DOM)属性精度(DLG)要素分类与代码的正确性、要素属性值的正确性、属性项类型的完备性、数据分层的正确及完整性、注记的正确性、属性表字段定义的正确性逻辑一致性(DLG)拓扑关系建立的正确性、多边形闭合、结点匹配完备性要素的完备性(DLG)、注记的完备性(DLG)现势性数据获取或更新时间附件质量文档资料的正确、完整性,元数据文件的正确、完整性注:斜体字表示适合各类数据2.2.2 间接质量评价空间数据质量间接评价是通过表2规定的质量元素来评价的。表2空间数据评价元素间接评价元素直接评价元素(质量元素)数据源质量
16、图形(像)数据质量数学精度、现势性、影像质量、完备性属性数据质量属性精度、现势性、完备性模型转换质量扫描处理、数字化质量数学精度、属性精度、逻辑一致性、完备性数据生成质量计算误差数学精度拓扑分析质量数学精度、属性精度图层叠置质量数学精度其他基本要求、附件质量2.2.3 空间数据质量度量模型采用任何一种质量评价方法都可以用一致的元素来度量空间质量。由于直接评价方法使用得更多,质量表达得更为准确,更适于用户判定产品适用性,因此常选用直接评价元素来作为数据质量度量的元素,并建立空间数据质量度量模型。空间数据质量度量模型见表3。表3空间数据质量度量模型一级质量元素二级质量元素质量度量评价基本要求文件名
17、称、数据格式、数据组织正确错误合格不合格数学精度数学基础平面精度、接边精度套合精度、高程精度格网间距正确错误平面中误差高程中误差正确错误合格不合格分值分值合格不合格图像或影像质量(DOM、DRG)分辨率反差清晰度灰度色彩一致性外观质量较差均差(同类地物在相同光照下的色彩值、光亮值、对比度差值的平均值)分值属性精度(DLG)要素分类与代码的正确性要素属性值的正确性属性项类型的完备性数据分层的正确及完整性注记的正确性正确、完整错、漏分值逻辑一致性(DLG)拓扑关系的正确性、多边形闭合、结点匹配正确错误分值完备性要素的完备性(DLG)注记完整性(DLG)完整遗漏分值现势性数据获取或更新时间现势状况合
18、格不合格附件质量文档资料的正确、完整性元数据的正确、完整性正确、完整错、漏分值注:斜体字表示适合各类数据2.2.4 空间数据质量评价方法的选取直接质量评价方法为主,间接质量评价方法为辅。采用直接质量评价方法对数据集进行质量评价后,可不再使用间接质量评价方法,但采用间接方法进行质量评价的,在正式提交成果时,还应使用直接评价方法进行质量评价。3 空间数据入库时的质量控制原始数据是直接由测绘部门按照数据生产的相关规范进行生产,并以数据的形式提供。对于数据生产的数据质量控制在这里暂不赘述,而主要针对入库的原始数据,按照空间数据的质量评价和质量度量模型,进行数据入库时的数据质量再检查。3.1 空间数据的
19、检查其内容主要包括:(1)入库数据文件是否齐全、完备;(2)空间数据的地理参考系统是否正确,是否满足整个数据库入库的基本要求;(3)数据格式检查:不同软件数据格式及转换的可行性;(4)空间位置的几何精度;(5)空间地理特征的完整性:是否所有的内容均数字化,数据是否漏空或重叠等;(6)空间特征表达的完整性:面状特征是否以面状的多边形进行表达;(7)类型一致性检查:分类、分层,线状地物是否连续,代码的一致性,矢量几何精度一致性、影像像元大小一致性、DEM格网大小一致性等;(8)拓扑一致性检查:拓扑关系、多边形闭合关系等;(9)数据接边检查:同比例尺接边处理、相邻图幅要素属性及几何图形接边检查、各时
20、期各种类型数据接边检查。空间数据的质量检查因产品类型和数据采集的手段不同,检查方法也略有不同,但检验内容大致相当见表4。表4空间数据的检查检验内容DLGDRGDEMDOM数学基础位置精度平面高程接边精度注:表中“”表示应做的检查内容对图形数据进行检查的方法有:(1)在屏幕上进行目视检查,将数据显示在屏幕上,对照原图检查数据的错误,如点、线、面目标的丢失,相互关系错误等;(2)利用软件进行检查:主要指应用建库软件本身的功能,检查数据拓扑关系的一致性,或者开发一些检查程序,检查数据的逻辑一致性和完整性,同时将发现的错误显示或打印出来;(3)绘制检查用图进行检查:利用数据生成绘图文件,绘制分要素或全
21、要素的检查用图,与原图套合进行检查。这些方法,往往交替使用,以便能够对图形数据进行认真、全面地检查。3.2 属性数据的检查与方法属性数据的检查主要包括要素分类与代码的正确性、要素属性值的正确性、空间数据连接关系的正确性等。检查时可以通过“库查图方式”逐级逐类检查其面状闭合性,线状地物的连续性或一致性。在屏幕上逐一显示要素,依据地图要素分类代码表抽样检查要素分类属性、代码的正确性,也可按属性取值调出图形元素,检查各属性值的正确性以及与图形元素关系的正确性。3.3 空间数据之间关系正确性的检查与方法空间数据之间关系正确性的检查(也称逻辑一致性和完整性)主要包括:多边形闭合状况、结点匹配精度、拓扑关
22、系的正确性等。检查时可填充颜色以检查其面状闭合性,或采用屏幕漫游目视检查以及计算机程序检查面状要素是否封闭、线状要素是否连续、同一地物在不同图幅的分类、分层属性是否一致,以保证空间数据之间关系的正确性。4 结束语通过上述讨论不难理解,地理信息系统的空间分析与决策主要依赖于空间数据库,空间数据质量的优劣直接影响到建库的质量。优质的数据是提供地理信息系统可靠运行的质量基础,其质量在很大程度上影响和制约着地理信息系统的可用性,为用户提供满足入库质量要求的空间数据是GIS建设的基础。由于空间数据库还是一门比较年轻的学科,对空间数据的质量和精度问题还有待于深入研究。对如何处理误差,没有成熟的规范可行,在
23、使用空间数据库时,既要看到数据误差的不可避免性,也要重视数据误差的危害性。对空间数据库数据质量控制的主要任务是针对可能产生误差的各个环节进行必要的控制,尽量减小这些误差的影响。质量控制贯穿于空间数据库建库的全过程,建成一个质量可靠的空间数据库,才能保证地理信息系统分析及辅助决策的科学性和准确性。参考文献:1 国家测绘局1:1万基础地理信息数据生产与建库总体技术纲要2001年6月2 国标 GBT18316-2001数字测绘产品检查验收规定和质量评定北京:中国标准出版社 2001年5月3 陈述彭、鲁学军、周成虎编著地理信息系统导论北京:科学出版社2000年5月4 汤国安、赵牡丹编著 地理信息系统北京:科学出版社 2000年10月5 魏克让、江聪世编著 空间数据的误差处理北京:科学出版社 2003年8月6 史文中著 空间数据误差处理的理论与方法北京:科学出版社 2000年5月7 王新洲、史文中、王树良编著 模糊空间信息处理武汉:武汉大学出版社 2003年10月8 毕硕本、王桥、徐秀华编著 地理信息系统软件工程的原理与方法北京:科学出版社 2003年7月9 杜道生、陈军、李征航编RS、GIS、GPS的集成与应用北京:测绘出版社,1995年9月专心-专注-专业
限制150内