服务粉丝

我们一直在努力
当前位置:首页 > 财经 >

教程|多尺度地理加权回归模型(MGWR)原理、应用、注意事项及其与GWR模型对比总结

日期: 来源:学研录收集编辑:前沿小助手

Part1模型介绍

多尺度地理加权回归(Multi-scale Geographically Weighted Regression ),是用来分析空间异质性的较新的手段工具,作为地理加权回归的优化模型,该方法允许为各自变量优化选择独立的带宽,使得结果更接近真实情况,得到更为可信的模型结果。
Waldo Tobler提出地理学第一定律告诉我们,空间上越接近的事物,其某种属性也越相似,距离越近则相似程度越高。(“All things are related, but nearby things are more related than distant things.”)。这其实反映了空间相关性,自然界中事物之间的相关性与距离有关。一般来说,距离越近,地物间相关性越大;距离越远,地物间相异性越大。
Michael Goodchild提出的地理学第二定律反映了空间异质性定律(Law of Spatial Heterogeneity)。空间上的隔离造成了地物之间的差异,即异质性。(分为空间局域异质性(spatial local heterogeneity)和空间分层异质性(简称空间分异性)(spatial stratified heterogeneity)。前者是指该点属性值与周围不同,例如热点或冷点;后者是指多个区域之间互相不同,例如不同的生态分区。
既然自然界众多现象都是具有空间自相关性和空间分异性,那么在进行设计地理位置变化(即空间数据)的回归分析时,采用传统的线性回归方式,利用众多数据的平均回归结果则只能揭示出数据之间的平均线性关系,忽略了空间上的细节差异信息,也即空间现象之间的异质性被忽视了。
全局回归: Y=a·X1+b·X2+c·X3+……+ε
利用所有数据整体情况,回归一次只得到一组参数
如何在回归过程中考虑这种地理现象的空间异质性信息?
进行局部区域的回归,需要确定一定空间尺度带宽)以及权重衰减方式核函数)进行系数回归,针对每一个样本单独进行回归,相当于进行多次局部线性拟合,回归出一系列参数。由此引出MGWR中的2个关键问题:
①带宽:也可理解为空间尺度,指的是用于估计统计量时所采用的空间数据的范围。
②在带宽范围内,这些不同的数据的的权重应该有差异(核函数)。距离被估计点越近的样本数据应该被赋予更大的权重,远处的点在参数估计中的权重应该小。
高斯核函数二向核函数

带宽选择过程中,不断比较被估计点处的模拟Y值和真实Y值之间的误差,选择使得模型残差满足设定要求时的带宽值。利用AICc等参数准则进行确定。

                (图片引自Oshan,2017)
经典GWR由Fotheringham在1996年提出,基于构建空间权重矩阵的回归模型,普遍用于空间的影响因素分析上。SGWR(半参数地理加权回归)由Fotheringham提出,有些学者叫做混合地理加权回归,仅能将不同变量的影响尺度分成全局和局部两类,无法进一步细分。MGWR由2017年由Fotheringham提出,于瀚辰等在2019年补充完善了MGWR的统计推断,从而使得该方法可以普遍地用于实证研究中。2020年沈体雁首次将该模型用于北京市的房价分析上。
GWR和MGWR都是探测一系列自变量对因变量空间分异性的有效工具。相比全局回归模型,比如OLS最小二乘法的优势:
GWR和MGWR比OLS多了空间信息,它可以在每一个样本位置都估计出一组因变量Y和自变量X1,X2,X3……之间的线性关系。
GWR和MGWR的关系:
相同之处:二者均是局部回归模型,均能得到局部位置的回归参数信息。
不同之处:GWR针对所有的自变量X1,X2,X3……,它在估计统计量时所采用的空间尺度(带宽)、核函数均是一致的。即针对所有自变量估计其系数时采用的空间数据范围相同,而空间数据分布的疏密不一、有的自变量在空间尺度上变化程度不同,采用统一的带宽和核函数会产生误差。
MGWR在为不同自变量进行系数回归时,考虑了各自变量差异化的空间分布异质性尺度,针对数据本身采用了不同的空间尺度和核函数。

Part2总结

地理加权回归限制各个变量的最优带宽完全相同,这是所有自变量带宽的平均值。多尺度地理加权回归对此进行了改进,它允许每个自变量的带宽不同。相比GWR,MGWR主要在以下几方面有改进:

①允许各个自变量在不同的空间尺度(带宽)下进行建模,弥补了GWR的不足。②不同自变量的带宽可以反映其空间尺度的指标。是全局概化影响还是局部变动性较大的影响。

③各自变量多带宽的方法更加接近真实过程。

MGWR结果比GWR更加可靠,多尺度回归的结果更加接近真实情况也更为合理。空间尺度的概念被合理应用到了模型中。方法的计算量较大,当数据样本量很大时,运行速度较慢。该软件可以在Alisona State University(ASU)免费下载(sgsup.asu.edu),目前最新的版本是2.2.1版本。另有Python版本的源码可供下载。另外,该模型在生态系统服务中应用大有前景,我认为生态系统服务研究中,如果使用到MGWR模型,会使得全篇文章更有亮点。

—END—

欢迎关注学研录
细心 用心 恒心
声明:资料源于网络,仅供学习,禁止商用,如有侵权联系我们立即删除。

相关阅读

  • 面向未来的策略语言框架(之一)

  • 如何描述未来的投资机会,这一直是投资圈内无形的壁垒,它不但割裂了财富管理者与资产管理者,也割裂了资产管理者群体本身,它使得众多资产管理者执着于对某个维度的信仰,导致投资圈
  • 长城边上,他用6年造出中国人的禅意空间

  • 2022年下半年开始,长城边上一座没什么实际用途的房子,引得一批又一批的建筑师与游人们专程前往,欣赏。这座金山岭·上院,是一处风景建筑,由建筑师柳亦春设计,615㎡,前后共造了6年。
  • 苹果专利 | 用于空间音频的虚拟听觉空间

  • 近日,美国专利商标局正式公布了苹果公司新授予的55项专利,涵盖AirPods(第三代)的设计和实用专利,以及两项空间音频专利。其中,根据Apple的说法,空间音频创建了一个3D虚拟听觉空间,允
  • 尺度惊人!年度最疯批来了!

  • 由疯批美人米娅·高斯&E大主演的尺度R级惊悚片《无边泳池》来了!本年度新片《无边泳池》中,由米娅高斯和知名欧美男星亚历山大斯卡斯加德主演,不是普通的恐怖片,是类似一种全新

热门文章

  • “复活”半年后 京东拍拍二手杀入公益事业

  • 京东拍拍二手“复活”半年后,杀入公益事业,试图让企业捐的赠品、家庭闲置品变成实实在在的“爱心”。 把“闲置品”变爱心 6月12日,“益心一益·守护梦想每一步”2018年四

最新文章

  • 教程|基于QGIS3.16的矢量数据属性查询和数据导出

  • 在进行GIS数据处理过程中,往往需要查询和导出数据,我们今天介绍在QGIS3.16中,如何进行矢量数据的属性查询,并把查到的数据导出。本次的数据使用沈阳市餐饮业的POI点数据,要求1:精