新版白话空间统计:空间分布模式
Posted 虾神说D
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了新版白话空间统计:空间分布模式相关的知识,希望对你有一定的参考价值。
CSDN的被爬虫专用声明:虾神原创,公众号\\知乎:虾神说D
转发、转载和爬虫,请主动保留此声明。
空间分布模式的英文是:spatial distribution pattern,所以也有的文章或者书上被翻译成空间分布格局或者空间分布范例。不过我一般习惯了称之为空间分布模式,下面就沿用分布模式这个术语来进行说明了。
在地理学中,“空间模式”一般是指人或者物体在现实世界中的组织和位置。可以指它们之间的距离的远近或者说它们之间的呈现的相对或者绝对位置的规律。
空间分布模式无处不在。它们既包括自然发生的模式,如某些植物会在某一地区集中生长;也可以是人为的模式,比如走在城市中发现便利店的概率。因为人类的思维无法记忆和处理大量的原始信息,所以天然的就会去寻找模式和趋势,并会把发现的这种模式称之为“经验”。(下面这张图真不是广告……虽然我是从广告里面截图出来的)
先不说自然界中天然存在所有的对象,作为社会经济发展中的重要研究手段,空间分布模式对社会形态进行研究时,在某种意义上是对人类行为的研究。
研究空间分布模式的研究人员试图理解为什么(这种)物体会被放置在(这个)特定的位置。例如,在全市范围内,对空间分布模式的研究,会对包括企业的位置、特定类型企业的数量,以及企业彼此之间距离以及与住宅区的方位等信息进行总体分析。在这种情况下,空间分布模式可以解释企业之间的竞争关系或者政策对某个行业的影响力等。
空间分布模式的研究作用非常之广泛,比如它可以帮助经济学领域中的商业广告和分销策略之间的因果联系。也有助于环境科学理解特定区域的特征以及人类对它们的反应等等。
——好吧,我承认,上面这几段话,是我翻译及改写自国外文献里面的(写在论文里面也木得问题啊),所以和虾神的风格不搭,就不算字数了,下面才是虾神的风格。
任何事务,在物理空间中出现都会被记录下一个位置,单个物体是没有分布这种形容词的,只有多个事务同时出现(在同一区域内),才会有分布一说。所以分布一般是指多个事务之间的相对方向、距离等物理定义。
比如篮球上经常有的三角战术:
就可以说:在这次进攻中,湖人队的主力进攻阵容呈现了三角分布。
形容分布可以有多种多样,但是分布的模式,作为规律的高度抽象提炼,一般就只有以下几种:
如果把随机和均匀合并为一种说法,那么空间分布的模式,就只剩下:聚集、离散和随机三种模式。
空间分布模式作为空间统计学最重要的研究内容(没有之一),甚至可以狭义的说,空间统计学,主要的工作就是研究空间数据的分布模式的。
下面通过一张图可以很明显表达出来,三种模式:
看到这里,不知道大家是否会有这样一个疑问:
你所有的例子里面,空间位置都是在变化的,比如上篇文章里面的学生跑出教室的随机分布,还是口令之下的均匀分布,或是解散之后的聚集分布,用于研究的样本个体的位置都是在不断变化,所以非常容易就分辨出它们属于那种分布模式。
但是,我们日常的研究中,比如做省域经济研究的时候,样本的空间位置是完全不会发生变化的:
这样,不就永远都是一种模式了么?
当然,某些时候,也是有意外的,比如东北第四省——海南:
言归正传——
我们做空间分析的时候,绝大部分都是不涉及位置变化的——数据的变化涉及到的是时序分析的范畴,时空一体化分析暂时不是我们的讨论范畴,我们通常只讨论截面数据的分析。
通常,空间位置在一次分析中(时序分析除外),并不会发生改变,所以我们一般通过属性数据的变化来判断空间分布,说起来可能很拗口,那么我们看看下面几张图:
如果说大学时候上课的位置可以代表身份,所以我们可以很明显的看出聚集现象:
那么在中小学,一般座位都是老师给安排的,所以从座位的分布,就能看出老师风格了:
第一种,就是老师直接把学生拉出去排队,按高矮顺序,然后直接安排座位(一般新生入学采用的模式,因为老师还不知道你是学霸学渣……):
这样不管你愿意不愿意,或者你的成绩如何,或者你的兴趣爱好如何,都不会被考虑了,直接扔到了座位上——这种情况,属于被判定为随机。
第二种,就是经过测试考之后,老师一般习惯于进行学霸编组在一起……这种组合,当然就是所谓是聚集分布了,学霸和学霸在一起,学渣和学渣在一起。
那么还有第三种分布,就是考试的时候,为了避免作弊,所以可能会出现两个年级混合编组的坐法:
每个学生,周边都不会出现自己人……这就是所谓的离散分布。
如果把每个学生的特征,数值化之后,变成他们的一个属性,那么以上三种分布模式,就可以很明确的看出,在计算空间分布的时候,他们的位置(三张图之间)相对位置和绝对位置实际上是没有变化的,只是在每个位置上面的属性信息发生了变化,从而形成了:
-
随机——谁也不知道旁边有没有自己的同伴。
-
聚集——学霸和学渣扎堆出现。
-
离散——只要在我周边的,一定不是我自己的人。
三种空间分布模式。
这也就是我们通常在空间分析的时候,经常要做的事情,空间位置不发生改变,但是属性信息发生了改变,从而空间分布模式也发生了改变。
当然,上面的图形的位置分布,还是比较理想的状态,实际上我国这种自然形成的行政区划,不可能出现如此有规律的分布,所以如何控制临近关系呢?这就得通过定义空间权重矩阵来进行控制了,这个内容,我们后面会开个专题来讲。
那么,空间分布模式,如何进行计算呢?下一篇我们来讲讲空间分布模式的第一个计算方法:莫兰指数(Moran‘s I)。
(待续未完)
CSDN的被爬虫专用声明:虾神原创,公众号\\知乎:虾神说D
转发、转载和爬虫,请主动保留此声明。
以上是关于新版白话空间统计:空间分布模式的主要内容,如果未能解决你的问题,请参考以下文章