admin管理员组

文章数量:1630615

原文链接

ArcGIS与地理加权回归GWR【二】以及MGWR软件下载https://mp.weixin.qq/s/IslFNMrulsmBYgd7aa26xQ

带宽,即核函数的覆盖范围,核函数计算出来的是或陡或缓的曲面,曲面底部的半径便是带宽,带宽越大,覆盖范围就越大,权重随着距离的增加衰减的也就越慢(曲面越缓),带宽越小,覆盖范围越小,权重随着距离的增加衰减的就越快(曲面越陡)。

带宽过大会导致回归参数估计的偏差过大,带宽过小又会导致回归参数估计的方差过大,过大或者过小都会导致结果的不准确性,因此确定合适的带宽大小十分重要。

 ‍带宽的确定 

在ArcGIS中,带宽方法的选择会有AICc、CV、BandWidth_Parameter三个选项。核类型有Fixed和Adaptive(这个下面会提)。

而常用的带宽优化方法一般有以下几种,了解就行啦反正也看不懂。

1、CV 交叉验证

代表回归参数估计不包括回归点本身,即只根据回归点周围的数据点进行回归计算,这样当b变得很小时,模型仅刻画i附近的样本点但不包括i本身。把不同的带宽b及其对应的CV值绘制成趋势线,就可以直观的找到最小的CV值对应的最优带宽b。

2、AIC 赤池田信息准则

Akaike通过极大似然原理的估计参数方法加以修正,提出了AIC,Brunsdon和Fotheringham将其进一步用于地理加权回归分析中的权函数带宽选择。

别看了,看不懂的

下标c为“修正后的”AIC估计值,n为样本空间单元的数量,σ^为误差项估计的标准离差,AIC有利于评价GWR模型是否比OLS模型更好的拟合数据。AIC最小的就是坠好的

后面这两个不写了,反正ArcGIS里就CV和AIC,MGWR里多了个BIC。

3、BIC 贝叶斯信息准则

4、SI 平稳指数

 自适应权函数 

上述最优带宽的选择比较适用于地理空间单元数据均匀分布的情况,如果数据在区域内分布不均匀,数据密集的地方借用的点就多,数据稀疏的地方借用的点就少,要不就是偏差太大或方差过大。针对这种情况,可以根据数据疏密程度,在不同回归点上选取不同的带宽,即在数据稀疏的区域采用较大的带宽,而在数据密集的区域采用较小的带宽,这种在不同回归点上采用不同带宽的方式,就成为自适应权函数。有高斯函数和Bi-square函数。在上篇结尾提过ArcGIS与地理加权回归GWR【一】

所以这也就是前面ArcGIS中让选择核类型是Fixed(固定)还是Adaptive(自适应)


ps:ArcGIS中只有高斯核

  • 参考:《空间数据分析》


我觉得写这么简陋有点水了,下面提一下MGWR软件以及样例数据下载,因为我想拿样例数据来练习做,还是会用ArcGIS做的,不能偏题啊也

ASU网站:https://sgsup.asu.edu/sparc/multiscale-gwr

根据自己电脑情况下载即可,点下载会让填两个信息,随便填一下就行

Sample Data,下载这个Georgia的受教育程度及各因素的空间差异

数据包括矢量和表格。

PctBach:本科以上人口占比(因变量),PctRural:乡村人口占比,PctEld:老龄人口占比,PctFB:外国出生人口占比,PctPov:贫困人口占比,PctBlack:非洲裔美国人占比,TotPop90:1990 年人口数量。

不想动手的公众号回复关键词【MGWR】自取。

本文标签: 软件下载地理ArcGISMGWRGWR