地图数学模型原理_结课作业(14页).doc
-地图数学模型原理_结课作业-第 14 页武汉大学研究生结课作业地图数学模型原理与分析院(系)名称:资源与环境科学学院专业名称:土地资源管理学生姓名:秦坤指导教师:何宗宜 二一五年六月一、在空间数据库中,把大比例尺图形数据缩编成小比例尺,图形数据是按要素分层的,各要素应采用什么模型确定选取指标?答:地图缩编通常会将图形数据按要素分层,如居民地、河流、道路等图层,各种要素选取指标的确定通常又有多种模型可以选择,下面采用一元回归数学模型说明居民地和河流的指标选取过程。1.居民地选取指标模型确定居民地选取指标的模型包括一元回归模型、多元回归模型、图解计算法、开方根规律模型等,下面采用一元回归模型为例进行说明;(1)根据地图制图综合原理,资料图上居民地密度越大,新编图上居民地选取程度(选取百分比)越低。居民地选取程度与居民地密度之间存在着相关关系,依据这种相关关系可建立二者之间的回归模型。相关关系可用幂函数来表示:y=axb,其中a,b是待定参数。例如根据某制图区域1:20万地形图上量测的样品数据可得居民地选取程度数学模型为y=7.47x(-0.65),有了居民地选取程度模型,只要知道资料图居民地密度,就可以计算出新编地图居民地的选取程度(或选取数量)。同理可对全国范围内已成的各种比例尺地形图作了大量的实际观测,建立相应的居民地选取指标模型;(2)在实际地图制图数据处理中,常常是以与之比例尺相差不远的地形图作为资料图。考虑实际需要,通过数据分析处理,可得到相应的数学模型如下图所示:图(1-1)2.河流选取指标模型(1)确定河流选取指标模型主要有一元回归模型、多元回归模型、方根模型等。实施地图综合时,应根据具体情况,选择合适的模型,下面以一元回归模型进行说明;(2)河网密度是确定河流选取指标(标准)的基本依据。河网密度系数 ,其中L是河流的总长度,P是河流的流域面积,根据自然界的规律,河网越密该区域小河流就越多,即河网密度系数K和单位面积内的河流条数有相关关系:= ,其中n是河流条数。依据河网密度系数K和单位面积内的河流条数的相关关系,可建立河网密度系数K的数学模型。根据样本数据的实验结果,可用幂函数建立河网密度的数学模型: ,a和b是待定参数;(3)我国多年来的编图实践,使得不同密度的地区河流选取形成一套惯用的标准,如下图:图(1-2)二、在空间数据库中,把大比例尺图形数据缩成编小比例尺,图形数据是按要素分层的,各要素应采用什么模型确定具体的选取?答:地图缩编通常会将图形数据按要素分层,如居民地、河流、道路、地貌等图层,各种要素具体的选取通常由各自的模型来决定,下面以河流和地貌为例阐述要素的具体选取过程。1.河流结构选取模型(1)河流结构选取数学模型分为“等比数列法”、“模糊数学模型”和“图论模型”三种,下面以“模糊数学模型”为例进行说明;(2)河流模糊数学模型的实施过程包括以下五个方面:l 地图上河流选取主要考虑河流的长度、河流的密度(间距),以及河流在人文、地理位置上的重要性和河网类型等。因此,地图上对河流选取的因素集合为U=u1(河流长度),u2(河流间距),u3(河流的重要性),u4(河网类型)l 河流选取的评判集:在地图制图综合中,对河流只有选取或舍去,故河流选取的评判集为V=v1(选取),v2(舍去)l 影响河流选取的四个因素中,它们所起的作用并不相等,所以要对这些因素分配不同的权重。根据专家评定和统计分析得 = (,)l 模糊综合评判矩阵:为了得到模糊综合评判矩阵,必须首先确定各因素对选取河流的隶属度:河流长度对其选取的隶属度的确定根据等比数列选取表,当河流长为Li时,资料图上河流间隔为di时,利用回归分析方法,可求出选取时所需的河流间隔C。这个C值是河流选取和舍去的临界值,隶属度为。因此,有 式(2-1)式1中,D为河流选取时与已取河流间隔值。河流间隔对其选取的隶属度的确定在制图综合中,河流间隔越小,选取河流的长度越长;因此,利用回归分析可求出河流长度S和河流间隔d之间相关关系。同样,S值是河流选取与舍去的临界值,隶属度为。所以有: 式(2-2)式2中,L1是选取的最短河流长度,L为河流长度。河流在人文、地理位置上重要性对河流选取隶属度的确定河流在人文、地理位置上重要性对河流选取的作用是比较复杂的模糊概念,根据地图制图的理论知识,采用仿数量化的方法定值(如表1所示)表(2-1)河流重要性重要一般次要100503河网类型对河流选取隶属度的确定河网类型对河流选取的作用也是比较复杂的模糊概念,同样,根据地图制图的理论知识,采用仿数量化的方法定值(如表2所示)表(2-2)河网类型树枝状格子状平行状扇状辐射状网状060050055050056055l 模糊综合评判结果集:根据模糊综合评判矩阵和因素权重集 ,通过模糊变换可得到评判结果式(2-3)根据最大隶属原则,如果b1>b2,该河流选取,如果b1<b2,该河流舍去。为防止出 现b1=b2的情况,要采用清晰大的模糊算子。2地貌结构选取模型l 地貌结构选取模型基本原理:在地貌综合时,谷地长且间距大的地区,谷地选取可能性大;谷地短且间距小的地区,谷地选取可能性小。当谷地长度很大时,不考虑谷间距的大小;当谷间距特别大时,也不考虑谷地长度。但对于切割破碎为特征的地区(例如,风蚀地形、劣地等)。谷地虽然都比较小而且密度大,那么选取的比例也应大一些。因此,谷地选取表中除正常使用的部分之外,还要增加一部分在特殊情况下使用的辅表。l 地貌结构选取数学模型:(1)谷地长度分级数列Ai的确定 地图上能表达的最短谷地为左右。因此,通常把长度在1mm以下的谷地称为小谷地,即A1=1mm ,把长度在5mm以上的谷地称为大谷地,即An=5mm由于,A1与An之间数值范围很小,因此,按等差分级,即A2=3 mm,可将谷地分为“<1”,“13”,“35”,“>5”总共4级(单位mm);(2)谷间距(谷地密度)分级数列Bj的确定地图上可以表达的最小谷间距为,所以B1,取 ,根据前面公式有 B2= B1×,B3=1.3mm ,B4, B5=3.3mm ,B6,B7。其中,是正常情况下两条谷间距的最小间隔。当谷间距时,2cm内已不到3条谷地,只要能清晰表达的谷地都可以选取。 (3)选取表的构成地貌谷地选取表分成两个基本部分,即一般地区适用的部分和特别破碎地区适用的部分,这两部分是连续的。从破碎地区到一般地区可以逐渐过渡,即两个部分应有机地结合起来。其结合部的右则为主表,适用于一般地区;左则为辅表,适用于特别破碎地区。(4)选取数列Clk的确定辅表是为破碎地区而设置的,选取标准相应低一些,以相邻等级的间隔平均值之差的一半作为级差逐步降低。根据上述计算结果,组成地貌等高线表示的谷地选取模型 l 利用谷地选取模型,根据谷地的长度和谷间距就可确定谷地的取舍。当谷地长>5mm时选取,谷地长<0.5mm 时舍去;当谷地长在5mm之间时,只要知道谷地确切的长度值和它与两侧谷地的平均间隔就能确定是否选取。选取谷地时,要按由大到小的原则。三、确定河流选取程度的数学模型为:式中,y为河流选取程度,x1为资料图上单位面积河流条数,x2为资料图上单位面积河流长度(河网密度),b0、b1、b2为待定参数。试分析b0、b1、b2意义和取值范围。答:以往确定河流的选取标准(指标)时,通常是根据地区的河网密度。事实上,河流的选取不但与单位面积河流的长度(河网密度)有关,还应与单位面积河流的条数有关。因此,确定河流选取程度的数学模型为 (3-1)式中, 为河流选取程度, 为资料图上单位面积河流条数, 为资料图上单位面积河流长度(河网密度),b0、b1、b2为待定参数。设 为单位面积内河流选取的条数,则有: (3-2)把(3-2)式代入(3-1)式有: (3-3)下面对参数b0、b1、b2的性质进行讨论。(1)参数b0在模型公式中3-1中,当b1、 b2、为常数时,选取程度随b0增大而增加,这时b0决定着选取的总程度(水平)。当b0=0时, =0,河流全部舍去;因此b00(2)参数b1在模型公式中3-1中,当b0、 b2、 为常数时,b1一定,由不同的能得到不同的。这时b1决定着不同河流密度的河流选取程度。显然,b1不能为正值。如果b1>0,选取程度将随着增加而增大,也就是说河流密度越大,选取程度越大,这是违背地图制图综合原理的。当然,b1也不能小于-1。若b1<-1,那么由公式(3-3)可以看出,河流密度越大的区域,河流选取数量反而越少,这也是违背地图制图综合原理的。所以:-1b10(3)参数b2在模型公式3-1中,如果b0、b1、不变,b2一定,越大则相应增大。决定不同河流密度的河流选取程度。如果b2<0,河流密度越大的区域,河流选取程度反而小,这是违背地图制图综合原理的。所以b20四、以数据的分布特征进行分级的方法有哪几种模型?各适应什么情况?答:地图制图的空间要素分级主要有以下七种分级模型:1 等差分级模型等差分级又包括界限等差分级模型和间隔递增等差分级模型。适应范围:数量间隔趋向呈等差排列,可采用等差分级模型。例如对统计地图的分级一般采用的就是等差分级模型。2 等比分级模型等比分级分为界限等比分级模型和间隔等比分级模型。适应范围:数量间隔趋向呈等比排列,通常较多运用等比分级方案,如地貌结构选取模型、河流结构选取的数学模型等主要运用这种模型。3 统计分级模型包括面积相等分级模型、正态分布分级模型及其它分布分级模型。适应范围:由于分级界线的确定是以一些统计量为基础的,所以这类分级模型能较好地反映数据的分布特征。在地图上表示与区域面积分布有关的现象要素分级时,如各级面积均匀相等,或者最大和最小数据的级别所占面积较小,中间级别较大,基本上具有正态分布函数的特征,或者各级面积的对比具有其它分布函数特征,一般采用统计分级模型较为合适。统计分级模型还可以用来分析分级统计地图或等值线图上各级(层)面积分布的合理性。4 具有数学法则的最优分级模型包括任意数列分级模型和任意级数分级模型。适应范围:这类分级模型一般适用于那些数据本身能提供大量信息,可根据一定的数学规则确定分级界线,使分级结果更能反映数据分布特征的情况。5 最优分割分级模型在地图制图数据处理中,有些样本的次序是很重要的,不能随便将它们的次序打乱。例如,一些与年代有关的地图制图数据处理,年代就是有序的,最优分割分级模型解决这类数据分级问题比较有效。6 逐步模式识别分级模型这种分级模型根据模式识别的基本原理进行分级,适合于大批量数据的分级。7 聚类分级模型为使分级结果便于数值估读,使估读误差尽可能小,可以采用统计上的聚类分级方案。五、论述采用模糊多层次评判数学模型建立空间数据质量(土地定级)评判模型的原理与方法。答:1、对土地是由地貌、土壤、植被、水文、气候等自然要素长期相互作用, 以及受人类活动的影响所形成的自然综合体。针对土地本身的复杂性及其质量评价方面存在的模糊性特征, 对土地进行分等定级评价,需要考虑的因素很多。在评价过程中作出任何一种结论都得对若干有关联的因素做综合考虑。因此,在评价过程中都对应着不同层次的若干因素的综合考虑,故宜采用模糊数学中的多层次综合评判法来建立评价数学模型。这种数学模型就是先把因素划分为几类,接着对每一类作出简单的综合评判,然后再根据评判的结果进行类之间的更高层次的综合评判。2、下面以土地定级为例,介绍模糊多层次评判数学模型:(1)确定评价因素集U(如表3所示)表(5-1)u1土壤c11土壤盐化程度c12土壤有机质含量c13土壤无机养分综合指数C14土壤质地u2地貌c21地貌类型c22海拔高度u3水文c31潜水埋深c32潜水矿化度c33排灌条件u4植被c41植被类型c42覆盖率及适口性c43粮食产量c44产草量u5气候c51粮食作物光温利用率c52棉花光温利用率c53牧草气候利用率U6其他C61GDP总量以上提出的评价标准是按重要程度大小列出的,在各层次中,前面因素比后面因素的重要性要大。(2)确定评价等级集V一般将土地级别分为:I级、II级、III级、IV级四个等级,V=(v1,v2,v3 ,v4)(3)确定评价因素的权重集由于在评价土地质量中考虑到了影响土地质量的所有因素,所以权重集也具有权向量的意义。为了使评价结果客观地反映实际情况,提高模型的评价精度,权重集采用层次分析法来确定。用层次分析法确定权重集,一般有如下两个程序:I:构造判断矩阵针对上一层次因素U,将讨论层次有关因素之间的相对重要性用数值表示出来,并列成矩阵形式如下表(5-2)其中,表示对U而言,比相对重要性的数值表现形式。一般取值为1,2,3.9及它们的倒数,其含义为:1表示 与同等重要;3表示比重要一点;5表示比 重要;7表示比重要得多;9表示比重要很多。2,4,6,8分别有3,5,7,9相应的类似含义,只是程度稍小些。如果因素重要性差别更小,可用带小数的数值表示,如,等。II:计算权重值计算本层次与上层次某因素有联系的因素相互重要性次序的权重值,其实质可归结为计算判断矩阵的特征向量问题。为简化计算方法,可用近似计算法和积法来求解,其步骤为 将判断矩阵U的各列正规化 各列进行正规化后的判断矩阵按行加总 对加总后的向量再进行正规化,所得结果W 即为欲求的特征向量,W的各分量即为相应元素的权重值。现用层次分析法确定空间数据质量的评价因素集合U各级权重集。在各层次中,根据评价因素的相互重要性关系分别构造判断矩阵,并计算W (如表4所示)表(5-3)由上表得采用层次分析法计算出的各级因素权重集(4)评价计算I:首先求出末级因素对评价等级V的隶属度在评价土地质量中一般有三种方法确定因素对评价等级V的隶属度 打分法。统计出全部评委各种评价的隶属频率。例如在评价“指标处理合理性”时,14%的评委选择“I”,51%选择“II”,25%的评委认为是“III”,10%认为是“IV”。由此即可得出该因素的评价等级集V的隶属度为(r11 ,r12 ,r13, r14)=(,)。 全图综合评定法 隶属函数确定法在评价中应该根据具体情况来选择这三种方法中的最合适方法。一般来说,集体评价土地质量时,三种方法都能用上。如果只有一人或两三人时,只能在后两种方法中,根据具体因素选择其中较合适的方法。 II:根据末级因素的评价等级集V的隶属度可直接构造 的单因素评价矩阵。如式(5-1)并且,直接得到评价结果 = III:由、求出评价结果。在土地质量评价中,要考虑所有的评价因素的影响,且评价计算过程中信息量损失尽量小,因此,采用M模糊算子,如式(5-2)同理可得IV:根据评价结果,评价矩阵, 式(5-3)V:由、求出评价结果 式(5-4)VI:由构造式(5-5)VII:由和求出评价结果 式(5-6)VIII:由的各子集的评价结果构成的单因素评价矩阵 IX:由和最后求出空间数据质量的评价结果 式(5-7)(5)确定土地质量的等级根据最大隶属度原则,确定被评价的土地质量等级,也就是看b1,b2,b3,b4四个数值中谁最大,评判结果定为相应的等级。如果b3最大,那么该土地质量应定为“III级”。六、试分析空间分布趋势模型与动态分析预测模型的异同点。答:1、相同点:都是通过一些已知要素的特征分析估算其它要素的特征,都可以使用回归模型。2、不同点(1)从模型的研究对象来看:空间分布趋势模型的主要任务是研究空间要素地带性分布规律,并用数学方法建立分布规律模型,揭示组成地带性的基本区域结构,并尽可能顾及各区域的特殊规律,为地图制图综合、地图设计等提供科学依据。动态分析预测模型主要研究如何根据一种或几种要素来估计、推算或者预测其它有关要素的情况,确定要素之间相互制约的定量关系,这对于经济建设中的规划、设计和决策都有重要意义。(2)从模型使用数学方法来看:空间分布趋势模型一般是按规模大小分布的规律,运用数理统计中的递减指数分布函数拟合。动态分析预测模型使用回归分析方法,根据一组自变量来预测因变量的值。它建立的多个变量与因变量预测值之间的函数关系。七、试分析类型划分的贝利聚类模型与典型样本单元聚类模型的异同点。答:贝利聚类模型的分类原理:在每合并一次类后,需要根据合类样品各指标的平均值重新计算新的距离系数,再在新的距离系数矩阵中进行聚类;如此逐步计算合并,直至达到所需要的分类数目为止。典型样本单元聚类模型原理:典型样品单元的分类方法是先按距离系数矩阵确定典型的样品单元,然后把与这些典型单元接近的单元组成同种的区域(样品)单元类型。异同点:两者都是以距离系数为分类依据,但前者是先按照距离系数两两组合在一起进行分类,然后继续求距离系数再将两两组合进行分类,直到达到要求。而后者只进行一次距离系数的计算,同时划定典型单元,再依据距离系数将相近的分为一类。具体分类方法:1、贝利聚类模型:设有样品单元为各单元的指标为,变量为。经数据规格化并计算距离系数后得 假如在中最小,则A、B合并为一类;合并后计算A和B样本各指标相应的平均值,得 其余类推。据此计算新的距离系数矩阵,再进行分类合并。如果第二次是为最小,则合并C,D。那么,计算新的指标为再计算距离系数矩阵;如果第二次是为最小,则A,B,C应合并为一类,新的指标应为 。据此计算距离系数矩阵,进行分类合并。直至所需分类数目为止。2、典型样本单元聚类模型:(1)确定分类典型的起始单元首先计算各单元规格化指标组成的指标综合体,即如果,则表示该单元在m维空间中近似位于坐标原点附近,处于各单元的中央位置。因此,取Vi值最小的单元为假设起始单元,作为计算分类典型的“起算点”,用gm表示,即 (2)确定典型单元从矩阵D中选择与假设起始单元相应的距离系数列,在其中找出与gm相距最大的距离系数(gc1)这个与假设起始单元距离最远的单元,就是它与全部研究地区平均值(相应于维空间坐标原点)的最大差异的单元,作为第一个典型单元。第二个典型单元应与全地区平均值(gm)和第一个典型单元(gc1)的指标值均有最大的差别,这就需要在累加假设起始单元与各单元的距离值和第一典型单元与各单元相应的距离值之和中,选择距离累加值最大值的单元作为第二个典型单元(gc2)。然后是三个距离值累加取最大值确定第三个典型单元(gc3)。依次类推,直至所求的典型单元数目为所需分类数目为止。(3)确定单元分类(类型)其它未选入典型样品的单元,均与各典型样品单元比较,按分类距离系数的最短性分别归入各典型单元之中。这样组成的区域单元分类本身在地理意义上是同种的。八、简述数学形态学、分形理论、小波理论在空间多尺度处理中应用的现状和前景。答:空间数据多尺度处理与表示是当今地理信息科学领域研究的重要的前沿性课题。综合运用现代数学理论、计算机科学技术和计算智能技术,可为空间数据多尺度处理与表示的问题解决提供思路。近年来,数学形态学、分形理论和小波理论等现代数学理论和方法为智能化的空间数据多尺度处理,跨尺度的空间分析和自适应可视化等课题的研究提供了新的途径。 1数学形态学:数学形态学(Mathematical Morphology)诞生于1964年。最大特点是能将大量复杂的影像处理运算用基本的移位和逻辑运算组合来描述和实现,使得算法设计更加灵活,运算速度也大大加快。由于数学形态学从提出之初就主要用于处理二值图像,因而很自然地被应用于基于栅格数据模型的空间数据处理领域。1983年Monmoners首先用数学形态学腐蚀算子(erosion)研究栅格数据模型的面状要素地图综合。近十年来,不少学者用数学形态学研究空间数据处理问题,建立了化简、合并、删除、移位等综合算子的数学模型和算法。数学形态学在空间多尺度处理中的应用主要有以下几个方面:(1)在居民地街区综合中的应用居民地是重要的社会经济要素,在大比例尺(1:5万)地形图上,其面积载负量约为图幅的70%,对其实施综合的结果直接影响地图的质量。依比例尺街区的自动综合是目前空间数据多尺度处理的难题之一。研究依比例尺街区的自动综合对数字地图生产和基础地理信息系统建设都有重要的现实意义。将依比例尺街区处理成二值图像,用数学形态学能较好地解决依比例尺街区的自动综合问题。 (2)在数字地图要素移位处理中的应用移位是数字地图综合中很难实现的操作,用数学形态学能较好地实现数字地图要素的移位处理。数学形态学在数字地图要素移位处理中的应用又分为在线状要素与面状要素移位处理中的应用和在线状要素之间移位处理中的应用。2分形理论:自法国数学家Mandelbrot教授于1975年首次提出分形理论,这一理论已在广泛的领域中得到应用。分形理论既是非线性科学的前沿和重要分支,又是一门新兴的横断学科。分形理论在空间多尺度处理中的应用主要有以下几个方面:(1)分形理论在地图点状要素多尺度处理中的应用(2)在地图线状要素多尺度处理中的应用(3)在地图面状要素多尺度处理中的应用3小波理论:小波理论是目前最新的空间(时间)-频率分析工具,由于其具有“自适应性”和“数学显微镜”性质而成为许多学科共同关注的焦点。特别是小波理论中的多分辨率分析(MRA),因其可提供在不同分辨率分析表达信息的有效途径,尤其受到地学领域的高度重视。基于认识论的多尺度分析思想,利用小波变换的时频局部化特性和多分辨率分析,可使地理现象中有一定层次和大小的结构更易于提取和识别,从而可以用较少的小波系数来刻划多源、多尺度、大数据量的空间数据集的基本特征,为空间数据多尺度处理奠定了理论基础。