《2012计量地理学作业(共11页).doc》由会员分享,可在线阅读,更多相关《2012计量地理学作业(共11页).doc(11页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上计量地理学作业一、填空题1.计量运动,主要是由美国地理学家发起的,早期主要集中在几所大学。由于各校所持观点不同,研究方向不同,从而形成了各种不同的学派。其中,主要有如下三大学派:衣阿华的经济派、威斯康星的统计派、普林斯顿的社会物理学派。2、在聚类分析中,常用的聚类要素的数据标准化处理方法有如下几种:总和标准化、标准差标准化、极大值标准化、 极差标准化。3、风险型决策问题的常用决策方法: 最大可能法、期望值法、灵敏度分析法、效用分析法等。4.属性数据分为数量标志数据和品质标志数据。5.众数是总体中出现频数或次数最多的数。6.回归平方和的自由度为自变量的个数或K。7.地理
2、要素的空间分布类型有点状分布、线状分布、离散区域分布和连续的区域分布四种类型。8.概率密度函数积分就成为分布函数。9.将实际的地区数据与标准分布进行比较,用以测度经济地理现象在空间分布的程度采用空间洛伦兹曲线。10.绘制累积频数图时,横坐标表示组距或组中值,纵坐标表示累积频数。11、计量地理学的研究对象大致为下列三个方面空间与过程的研究、生态研究、区域研究。12、地理数据的基本特征 :数量化、形式化与逻辑化、不确定性 、多种时空尺度 、多维性 。13、参数检验中常用的方法有U检验、T检验、F检验。15、一般而言,地理数据具有以下几个方面的基本特征:数量化、形式化、逻辑化,不确定性,多种时空尺度
3、,多维性。16、描述地理数据一般水平的指标有平均值、中位数、众数;描述地理数据分布的离散程度的指标有极差、离差、离差平方和、方差与标准差、变异系数;描述地理数据分布特征的参数有标准偏度系数、标准峰度系数。17、什么是秩相关系数: 是将两要素的样本值按数据的大小顺序排列位次,以各要素样本值的位次代替实际数据而求得的一种统计量。18、线性规划问题的可行解:在线性规划问题中,满足约束条件的一组变量x=(x1,x2,,xn)T为可行解,最优解:使目标函数取最大(或最小)值的可行解称为最优解。19、在目标规划模型中,除了决策变量外,还需引入正、负偏差变量,其中,正偏差变量表示决策值超过目标值的部分,负偏
4、差变量表示决策值未达到目标值的部分。20、主成分分析的计算步骤:计算相关系数矩阵 ,计算特征值与特征向量 ,计算主成分贡献率及累计贡献率 ,计算主成分载荷。21、多元线性回归模型的显著性检验中,回归平方和U的自由度为自变量的个数k ,剩余平方和的自由度为n-k-1,n为样本个数。二、单项选择题1. 符号S2表示(A)。A样本方差B样本标准差 C总体方差D总体标准差2.以下说法正确的是(D)A. 总的离差平方和用y的估计值与算术平均值的离差平方和来表示B. 总的离差平方和用y的估计值与几何平均值的离差平方和来表示C. 总的离差平方和用y的观测值与几何平均值的离差平方和来表示D. 总的离差平方和用
5、y的观测值与算术平均值的离差平方和来表示3. 关于网络图的叙述哪个是正确的(C)A.网络图按比例尺画 B.点和线条的位置是固定的C.线段不代表真正的长度 D.具有几何图形的意义5.在单峰负偏态的分布上,下列叙述正确的(C )A 算术平均数=中位数=众数 B 算术平均数众数中位数C 算术平均数中位数Yc,属于A类,YbYc,属于B类,现有未知类函数值小于Yc,则其属于CA A类 B C类 C B类 D D类10. 下面有关小概率原则说法中正确的是(B )A 小概率原则事件就是不可能事件 B当一事件的概率小于显著性水平时, 认为该事件为不可能事件C基于”小概率原则”完全可以对某一事件发生与否作出正
6、确判断 D 总体推断中可以不予考虑的事件11.区域法测定临近距离一般分成(A )个区域。A 6 B 5 C 4 D 8三、名词解释题1、方差:各离差平方和除以其数据的个数。2、中项中心:两条相互垂直的直线的交叉点,这两条直线一般取南北向和东西向,每条直线把点状分布的点子二等分。 3、贝叶斯准则:把已知的地理数据分成几类(或几组),然后计算出未知地理类型或区域归属于各已知类型(或组)的概率值,它归属于哪一类的概率值最大,就把它划归该类(或组);另外,还可计算出划归各已知类的错分损失,即错分哪一类的平均损失最小,就把它判定为该类。4、计量地理学:应用数学方法和电子计算机技术进行地理学研究的方法。又
7、称数量地理学。5、罗伦兹曲线:罗伦兹(Lorenz)是美国统计学家,他提出一种频率累积曲线,是用观察数据的累积百分数绘成的曲线,即罗伦兹曲线,该曲线主要用于不同地理现象在区域分布上的差异,查明它们的地区分布特征和规律。6、最近邻点指数:实际最邻近距离与理论最邻近距离之比。7、中位数(也称中央数):将地理数据按从大到小排列,居中间位置的那个数。8、离差(偏差、离均差):指每一个地理数据与平均值的差,代表每一个数据与平均值的离散程度。计算公式为:10、计量运动:从上世纪50年代末期开始,首先在美国掀起了建立地理学法则的热潮。然而,究竟怎样建立地理学法则?不同学者从不同的角度作了探索,但一般都是将数
8、学、物理学、社会学、经济学的理论和方法引入地理学,探求地理事物的空间格局,其共同之处在于都是开展地理学定量化研究,建立定量模式。这种定量化研究之热潮,就是所谓的计量运动。1963年,美国地理学者鲍顿(I.Burton)称这一运动为“计量革命”。11、比例尺度数据: 这种数据是以连续的量来表示地理要素。以无量纲的数据形式表示测度对象的相对量。12、方差:离差平方和的平均数为方差。13、最近邻点指数:实际最邻近距离与理论最邻近距离之比。14、趋势面分析:是利用数学曲面模拟地理系统要素在空间上的分布及变化趋势的一种方法。它实质上是通过回归分析原理,运用最小二乘法拟合一个二元函数(自变量为二维平面坐标
9、) ,模拟地理要素在空间上的分布规律,展示地理要素在地域空间上的变化趋势。15、二项分布:又称为贝努里(Bernoulli)分布,是一种具有广泛应用的离散型随机变量的概率分布。其定义为:设有n 次试验,各次试验是相互独立的,每次试验某事件出现的概率都是p,某事件不出现的概率都是1-p,记为q,则对于某事件出现k(k=0,1,2,.,n)次的概率分布为:16、明科夫斯基距离 :i和j代表两个地点(或两个样品),xik代表第i个地点第k个指标的值,xjk代表第j个地点第k个指标的值。17、相似系数: 设有n个地点,每个地点有m个特征值,如把每个地点的特征值看作是多维空间的一个向量,则两个地点之间的
10、相似程度可用两个向量间夹角的余弦来表示。 i和j代表两个地点(或两个样品),xik代表第i个地点第k个指标的值,xjk代表第j个地点第k个指标的值。18、相关系数(r):相关系数是变量之间相关程度的指标。样本相关系数用r表示,总体相关系数用表示,相关系数的取值范围为-1,1。i和j代表两个地点(或两个样品),xik代表第i个地点第k个指标的值,xjk代表第j个地点第k个指标的值。五、问答题1.如何用顺序法求得最临近距离。1)在某一地区分布n个点,以任意一点作为基准点,测定从这一点到其它全部点的距离rih(hi,h=1,2,n)2).其次测定从基准点i到区域边界的最短距离rib,在所测定的n-1
11、个距离中,选出rihrib条件的距离(这一条件称为边界条件),假定选出的是p个距离,从小到大顺序排列为ri1,ri2,ri3,rip。3).若i有j个此种距离,则称rij为i的第j级距离。矩阵第一列的要素和就是最邻近距离的合计。用其除以n1,得最邻近平均距离。2、回归分析与相关分析的联系与区别: 联系: 二者都是研究和处理变量之间相互关系的一种数理统计方法区别: 1)相关分析主要是研究要素(变量)之间联系的密切程度,并没有严格的自变量与因变量之分;而回归分析则主要是研究要素(变量)之间联系的数学表达形式,因而就有自变量与因变量之分. 2)相关分析中所涉及的变量与全是随机变量,而回归分析中因变量
12、是随机变量,自变量可以是随机变量,也可以是非随机的确定变量.通常的回归模型中,我们总是假定是非随机的固定变量. 3)回归分析可由自变量的取值来预测,延长或插补和控制因变量的取值,所以回归分析尚有地理预测的性质.3、主成分分析的计算步骤是什么? (见课件)对原始数据进行标准化处理:消除数量级和量纲的影响。计算相关系数矩阵rij(i,j=1,2,p)为原变量xi与xj的相关系数 。 计算特征值与特征向量 解特征方程,求出特征值,并使其按大小顺序排列,即 分别求出对应于特征值的特征向量ei=ei1,ei2,eij 计算主成分贡献率及累计贡献率贡献率: 主成分分析把p 个原始变量x1,x2,xP的总方
13、差分解为p 个不相关的变量z1,z2,zP,方差之和= 1 + 2 + + p 。主成分分析的目的就是为了减少变量的个数,一般是不会使用所有p 个主成分的,忽略一些带有较小方差的主成分将不会给总方差带来大的影响。由此可进一步得到i主成分的方差占总方差的比例称此方差比例为主成分Zi 的贡献率。第一主成分的贡献率最大,这表明Zi综合原始变量x1,x2,xP的能力最强,而x2,xP的综合能力依次减弱。累计贡献率:若只取前m(mp)个主成分,则称为主成分z1,z2,zm的累计贡献率,累计贡献率表明z1,z2, zm综合x1,x2,xP的能力。通常取m,使得累计贡献率达到一个较高的百分数.一般取累计贡献
14、率达85-95的特征值1,2,m所对应的第一,第二,第m(mp)个主成分。 计算主成分载荷主成分Zi与变量X j的相关系数称为主成分负荷量.因此,第i 个特征向量 e i的第j 个分量eij描述了第j 个变量对第i 个主成分的重要性,它与Zi和X j之间的相关系数成比例。计算各主成分得分:根据下列公式计算主成分得分Z1 =l l1x1*+ l l2x2* + l lpxp* z2 = l 21x1*+ l 21x2* + l p1xp* zm = lm1x1*+ lm2x2* + l ppxp* xp*为标准化后的数据.得到主成分得分矩阵:4、最短距离法进行聚类分析(见课件)5、相关系数的性质
15、有哪些?(1)相关系数可正可负; (2)相关系数的区间是-1,1; (3)具有对称性;即X与Y之间的相关系数(rXY)和Y与X之间的相关系数(rYX); (4)相关系数与原点和尺度无关; (5)如果X与Y统计上独立,则它们之间的相关系数为零;但是r=0不等于说两个变量是独立的。即零相关并不一定意味着独立性; (6)相关系数是线性关联或线性相依的一个度量,它不能用于描述非线性关系;(7)虽然相关系数是两个变量之间的线性关联的一个度量,却不一定有因果关系的含义;6、地理数据的标准化原因和目的是什么? 常见标准化方法有哪些?涉及到通过各种途径和手段所得到的有意义的地理数据。要素(或指标)的量纲、数量
16、级和数量变化幅度的差异,有可能突出某些数量级特别大的变量对分类的作用,而压低甚至排除了某些数量级很小的变量对分类的作用。消除量纲的不同和使每一变量都统一在某种共同的、相对均匀化的数值范围内。 标准差标准化: 在式中,式中: j为第j个变量的平均数;Sj为第j个变量的标准差。由这种标准化方法所得到的新数据,各要素的平均值为0,标准差为1。总和标准化。分别求出各聚类要素所对应的数据的总和,以各要素的数据除以该要素的数据的总和,即 极大值标准化,即经过这种标准化所得的新数据,各要素的极大值为1,其余各数值小于1。 极差的标准化,即 经过这种标准化所得的新数据,各要素的极大值为1,极小值为0,其余的数
17、值均在0与1之间。7、什么是随机型决策问题,它可以进一步分为哪几类问题?各类问题有什么异同点?对各类问题分别有什么决策方法,并说明各决策方法的基本原理随机型决策问题指决策者所面临的各种自然状态将是随机出现的。 随机型决策问题,必须具备以下几个条件: 存在着决策者希望达到的明确目标; 存在着不依决策者的主观意志为转移的两个以上的自然状态; 存在着两个以上的可供选择的行动方案; 不同行动方案在不同自然状态下的益损值可以计算出来。 )随机型决策问题可进一步分为风险型决策问题和非确定型决策问题。 1)风险型决策问题:每一种自然状态发生的概率是已知的或者可以预先估计的。 2)非确定型决策问题:各种自然状
18、态发生的概率也是未知的和无法预先估计的。解决风险型决策问题的方法有:1)最大可能法将大概率事件看成必然事件,小概率事件看成不可能事件的假设条件下,通过比较各行动方案在那个最大概率的自然状态下的益损值进行决策。2)期望值决策法计算各方案的期望益损值,并以它为依据,选择平均收益最大或者平均损失最小的方案作为最佳决策方案。 3)树型决策法树型决策法的决策依据是各个方案的期望益损值。计算过程一般从每一个树梢开始,经树枝、树杆、逐渐向树根进行。决策的原则一般是选择期望收益值最大或期望损失(成本或代价)值最小的方案作为最佳决策方案。4)灵敏度分析法由于状态概率的预测会受到许多不可控因素的影响,因而基于状态
19、概率预测结果的期望益损值也不可能同实际完全一致,会产生一定的误差。对可能产生的数据变动是否会影响最佳决策方案的选择进行分析,这就是灵敏度分析。 5)效用分析法考虑决策者个人的主观因素对决策过程产生影响,即决策者的主观价值概念(效用值),并将其应用于决策过程的方法。解决非确定型决策问题的方法有:乐观法其决策原则是“大中取大”。悲观法其决策原则是“小中取大”。折衷法特点是,既不乐观,也不悲观,而是通过一个系数,表示决策者对客观条件估计的乐观程度。等可能性法以各状态发生的概率相等为假设的期望值决策分析方法。后悔值法后悔值,是后悔值法决策的主要依据。所谓后悔值,是指某状态下的最大效益值与各方案的效益值之差。后悔值法,也称最小最大后增值法。8、“和积法”求最大特征根和对应特征向量(见课件)(S1)将矩阵的每一列向量的归一化得:(S2)对按行求和得:(S3)将归一化,即有:,则有特征向量:(S4)计算与特征向量对应的最大特征根的近似值:此方法:实际上是将的列向量归一化后取平均值作为的特征向量。专心-专注-专业
限制150内