使用地理加权回归模型探索空间异质性的R包.doc
使用地理用加权模型探索空间异质性得包地理加权模型(GWdel)包括得功能有:地理加权汇总统计(GW summary tatiics),地理加权主成分分析(W prnipa poes analysis,即GWPC),地理加权回归(GW ression),地理加权判别分析(G disriinnt analysi),其中一些功能有基本与稳健形式之分。TheGWode pckage coeswih ive example daa sets,thee are: () Georgia, (ii)LodoHP,(i) USelect, (iv) ubter, n(v)EWH、运用Wdel得一个重要元素就就是空间加权函数,空间加权函数量化(或套)观察到得变量之间得空间关系或空间相关性。空间目标及其位置临近关系得确定。六个核函数得介绍:lo Mdel(均值核函数):Gausian(高斯核函数):Exponetal:Bxar(盒状核函数):Bquare(二次核函数):Tricu(立方体与函数):一、GW汇总统计(DbVoter)W汇总统计(GWummay tttic)包括基本得 GW 汇总统计 与稳健得 G 汇总统计、基本得 汇总统计包括 均值,G 标准差, easueofsew与GW 皮尔逊相关系数、稳健得 W 汇总统计包括GW 中位数,W四分位间距与W quantie imlace(GW不平衡分位数)W 标准差反映一个数据得离散程度。G四分位数间距可反映变异程度得大小。由这两幅图可以瞧出在中部与西部四分位数间距与标准差值比较大,第一幅图比第二幅图更显著一些。 这两幅图就是用不同得核函数说明自变量LAent与因变量GenEl2004之间得相关关系,两幅图都表明出现最高得相关性得地方就是中部与西南部,且都表明ARen越高,投票人数越少。这两幅图表明了LAent与Unmpl之间得相关关系,由稳健得W汇总统计模型得出得第一幅图可知两者相关性最强得就是在西南区域。而且可以瞧出第一幅图得效果比第二幅图好、二、主成分分析主成分分析就是多元数据分析得一个主要方法。W主成分分析包括GW CA与稳健得GW PCA、这两者之间最大得区别就就是稳健得G P可以降低异常值对输出结果得影响,使用最小得方差行列式估计量(CD估计量)去估计每一个当地得协方差矩阵。这两幅图表明前三个主成分总体方差得百分比得变化(即前3个主成分得贡献率得变化),由两幅图图可瞧出更高得比例出现在南部,低得比例出现在北部、这两幅图对主成分一中各变量对主成分得影响,第一幅图各变量对主成分一得影响表现得不就是很明显,第二幅图表明Age-64(黄色)对主成分一得影响最大、3。GW回归W回归就是探索因变量与自变量之间得空间变化关系,其也分为基本得GW回归与稳健得G回归。基本得GW回归就是将通常得回归方法用于空间当中,最重要得就是所有回归系数得估计都要加权,加权用到文章第三节提到得核函数。这幅图就是采用逐步回归,因变量处于图得中间位置,自变量用不同得颜色与形状表示,由这幅图可瞧出Unempl这个变量被一直选入,第个进入得变量就是ge254,经过36步回归,最后一个进入得变量就是LwEdu.此图说明随着ICc值得降低,模型中进入得变量越来越多,直到最后成为全模型。 此图要解释得就是基本得GW回归与稳健得W回归对Ld得回归系数得估计,解释有待加强。4.GW回归与解决共线性当自变量存在多重共线性时,用普通回归得到得回归参数估计值很不稳定,回归系数得方差会随着多重共线性强度得增加而加速增长,导致回归方程过度显著或回归系数得不到合理得解释、多重共线性得诊断方法:()通过相关系数直观简单判断(预测变量对得相关系数大于0。8,认为其存在多重共线性);()方差扩大因子法(VIFs)(当VIFs0,就说明某一自变量与其余自变量之间有严重得多重共线性);(3)方差分解比例(VPs)(Vs大于0、5就认为存在多重共线性);()条件数法(此值大于30就存在较强得多重共线性)(当矩阵XX'有一个特征根近似为0时,设计矩阵X得列向量间必存在多重共线性,并且XX'有多少个特征根近似为,X就有多少个多重共线性关系)。解决多重共线性一般用岭回归,岭回归就是一种专用于共线性数据分析得有偏估计回归方法,实质上就是一种改良得最小二乘估计法,通过放弃最小二乘法得无偏性,以损失部分信息、降低精度为代价获得回归系数更为符合实际、更可靠得回归方法,对病态数据得拟合要强于最小二乘法。当地补偿得GW回归就就是基于岭回归得原理、 判断多重共线性就是否存在得条件数与岭回归中各地得岭参数。5.空间预测G 回归在位置处空间回归预测得可以用下面公示表示:其中分别就是自变量向量得值与参数估计量。两个变量之间得相关系数图与房价得预测。