《空间数据库技术应用电子教材-空间数据质量控制与评价.docx》由会员分享,可在线阅读,更多相关《空间数据库技术应用电子教材-空间数据质量控制与评价.docx(4页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、空间数据质量控制与评价1.空间数据质量控制的内容数字产品按其点位精度、属性内容、应用范围不同大体上可以分为:数据线划地图、数 字栅格地图、数字高程模型、数字正射影像等。因为数据采集手段不同,其质量控制内容也 有差异。数字地图产品的质量与空间数据库的数据质量不能混为一谈。从空间数据库的内容 来看,其矢量数据主要包括几何数据和属性数据两方面,几何数据在GIS应用中起着基础性 和重要性的作用,而属性数据对统计、检索等空间分析也至关重要,同时几何数据和属性数 据之间还存在着多种逻辑关系,因此几何数据和属性数据都是GIS数据质量控制的对象。(1)几何数据质量GIS的空间性决定了几何数据的基础性和重要性,
2、因此GIS空间数据的质量控制依然是 GIS的重要方面。数据位置的精度将直接影响数据库的应用,在质量控制检查中,对数据的 位置精度进行严格的检查和分析是十分重要的一环。空间对象之间的关系数据是描述各不同空间对象之间关系(如邻接、关联、包含、连通) 等信息,是GIS后续应用和空间分析的基础,因此,空间对象之间的关系数据的质量控制是保 证空间对象之间逻辑一致性的重要措施。(2)属性数据质量属性精度检查与控制是矢量数据质量控制中最主要、最复杂、最困难的工作。属性数据 的质量特征包括:1)描述空间数据的属性项定义(包括名称、类型、长度等)必须正确,属性表中各数据 项的属性取值及其单位不得有异常。目标编号
3、(标识码)是区分和标识空间数据的编码或代码,必须唯一有效、不重复。空间数据与描述它的属性数据之间的一一对应关系必须正确,空间数据和属性数据必 须具有正确的相关性。2)描述图形特征的代码必须正确,主要用于区分该目标是实体点、拓扑节点、有向点、 曲线、折线、特殊面还是一般面等。3)要素分层、分类、分级是否符合规定,目标划分是否正确。4)描述每个地理实体特征的属性编码是否正确。5)属性项是否完整、正确,属性变换点是否合理。6)河流、道路属性项是否按规定更新。7)属性扩充码应用是否符合规定。自动检查属性数据的正确性目前还是一个难题,比方原图是一条河流,数字化时赋的属 性是沟渠,那么无法使用软件进行自动
4、检查,需将属性数据可视化,对照底图,用人机交互的 方法进行,-1-(3)空间数据逻辑一致性的质量空间数据库中的空间数据与文件形式管理的空间数据(如CAD)之间的本质区别,在于 以文件管理空间数据时,更注重数字化线条的颜色、分类、线型及成图质量,而不考虑空间 数据之间的关系以及数据的后继处理。空间数据库中,空间实体间拓扑关系的关联、邻接、 包含、连通、层次等关系,是地理空间数据处理分析的依据。空间数据之间应具有如下逻辑 一致性特点:空间实体的点、线、面定义必须正确。保证多边形空间实体的封闭性。 保证线状空间实体的连接性。保证组合实体与基础图形要素之间的正确相关性,比方组合实体“建筑物”由建筑物
5、的外墙、标识码、门牌号等基本要素组成。保证符合组合实体间和基础图形要素之间的关系原那么或制约,其中包括: 连接性一一如农村道路可与公路连接,但不可与河流连接;相交性一一如公路可与河流相交; 共享性一一如墙可与台阶、楼梯、道路边线共享;落于性一一如地类图斑应位于行政区域内; 包含性 如基本农田可包含耕地图斑。所有线状要素相交处都应建立节点。保证空间数据之间拓扑关系的正确性是实现空间数据库数据处理和分析的基础,它的质 量特性是GIS系统区别于CAD系统的重要内容之一。(4)空间数据完整性的质量GIS系统中的图形数据和属性数据,包括注记不得有错漏和偏移,数据必须完备,每组 数据文件应该完整。2 .空
6、间数据质量控制的方法数据质量控制是个复杂的过程,要控制数据质量应从数据质量产生和扩散的所有过程和 环节入手,分别用一定的方法减小误差。空间数据质量控制常见的方法如下:(1)传统的手工方法质量控制的人工方法主要是将数字化数据与数据源进行比拟。图形局部的检查主要是目 视方法,将图形输出到透明图上与原图叠加比拟。属性局部的检查采用与原属性逐个比照或 其他比拟方法。(2)元数据方法数据集的元数据中包含了大量的有关数据质量的信息,通过它可以检查数据质量,同时, 元数据也记录了数据处理过程中质量的变化,通过跟踪元数据可以了解数据质量的状况和变化。(3)地理相关法-2-用空间数据的地理特征要素自身的相关性来
7、分析数据的质量。例如,从地表自然特征的 空间分布着手分析,山区河流应位于地形的最低点,因此,叠加河流和等高线两层数据时, 河流的位置不在等高线的外凸连线上,那么说明两层数据中必有一层数据有质量问题;假设不能 确定哪层数据有问题时,可以通过将它们分别与其他质量可靠的数据层叠加来进一步分析。 因此,可以建立一个有关地理特征要素相关关系的知识库,以备各空间数据层之间地理特征 要素的相关分析之用。3 .空间数据质量检查的方法数据质量检查是个复杂的过程,要控制数据质量应从数据质量产生和扩散的所有过程和 环节入手,因此,质量检查技术方法应根据数据库的内容、作业方法、人员水平、所使用的 软件等多因素确定,根
8、据具体情况和不同技术方法,主要可以归纳为以下三种。(1)人工实物核对检查将各种要检查的数据,根据其性质进行可视化,表现为人眼可见的图纸、报表、文档等 模拟形式的介质,然后根据这些计算机回放的资料与数据采集的原始资料进行人工比拟核对, 从而判断和确定数据的正确性。图形局部的检查主要使用目视方法。属性局部的检杳采用与 原属性逐个比照或其它比拟方法。因检查的质量受人为因素的影响较大,对于复杂空间数据 的检查可能存在较大的困难。(2)人机交互检查在GIS软件环境下,将要检查的数据可视化,以图形、图像、表格等形式显示在计算机 屏幕上,通过人工判断其正确性。也可以使用GIS的查询、统计、显示等功能组合,实
9、现对 数据的检查。这种方法能够任意组合,应用范围广泛,但对设备条件以及检查人员使用GIS 软件的能力有较高要求。(3)软件自动检查由于空间数据的图形与属性、图形与图形、属性与属性之间存在有一定的逻辑关系和规 律,可通过编制计算机程序,设计模型和算法,将数据中不符合规律、逻辑关系矛盾的要素 自动挑选出来,再使用人机交互的方式进行验证并修改。该方法准确率高、速度快,对复杂 的图幅检查效率较高。4 .空间数据质量控制的评价空间数据质量的评价方法可以分成直接评价方法和间接评价方法。直接评价方法是通过 对数据集抽样并将抽样数据与各项参考信息(评价指标)进行比拟,最后统计得出数据质量结 果。间接评价方法那
10、么是根据数据源的质量和数据的处理过程推断其数据质量结果,其中要用 到各种误差传播数学模型。针对数据质量的间接评价,需要使用一些基于概率论、模糊数学、 证据数学理论和空间统计理论等提出的误差传播数学模型,但这些模型的应用必须满足一些 适用条件,因此,目前间接评价法的应用还较少。在数据质量的评价工程应用中,使用较多 的是直接评价方法。直接评价法中,有缺陷扣分法、加权平均法、基于粗集的质量评价方法、基于模糊理论-3-的质量评价方法等。目前,从地理信息空间数据库生产的工程实践中,对空间数据进行质量 评价主耍使用质检软件方法进行质检,而通过对各类工程的质检软件检查工程说明中可以发 现,主要使用的是缺陷扣
11、分法。缺陷扣分法通过计算单位产品的得分值来评价产品的质量。其具体操作步骤为,设置单 位产品的总分值,一般设为100分,先对GIS数据产品中存在的缺陷进行判定,按照各缺陷的 严重程度进行扣分,再将各缺陷的扣分值累加,最后以总分值减去累加的扣分值作为该产品的 得分值,由得分值来判定产品质量。目前一般按缺陷的严重程度,将缺陷分为严重缺陷、重缺陷和轻缺陷3种。其中,严重 缺陷是指单位产品的极重要质量元素不符合标准,以致不经返修或处理用户不能正常使用的 缺陷;重缺陷是指单位产品的重要质量元素不符合标准或者单位产品的一般质量元素严重不 符合规定,用户使用时会造成重大影响的缺陷;轻缺陷是指单位产品的一般质量元素不符合 标准,对用户使用有轻微影响的缺陷。质量等级一般划分为优秀、良好、合格、不合格四个 等级。参考文献:1许从余.土地利用数据质量控制与评价体系研究D.浙江大学,20112张东明.地理信息系统技术应用M.北京:测绘出版社,20133王帆飞.空间数据库数据质量评测与质量控制体系研究D.四川大学,20054刘勖.GIS矢量数据质量控制技术研究D.东南大学,2008田劲松.GIS数据质量控制与数据转换研究D,合肥工业大学,2006 UD/T 1028-2010乡(镇)土地利用总体规划数据库标准,北京:中华人民共和国国 土资源部,2010-4-
限制150内