新版白话空间统计:莫兰指数之起源

Posted 虾神说D

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了新版白话空间统计:莫兰指数之起源相关的知识,希望对你有一定的参考价值。

CSDN的被爬虫专用声明:虾神原创,公众号\\知乎:虾神说D

转发、转载和爬虫,请主动保留此声明。


本文是帕克.莫兰小传——献给伟大的统计学家,空间统计学先驱莫兰同学


我们前面说了空间分布模式有随机、聚集和离散三种,不过这三种说法都是所谓的“定性”的称谓,而在分析里面,我们更需要的是“定量”。

复杂的多个数据,采用某种方法汇总成一个数值来对这些数据进行统一描述,这种做法被认为是统计学赖以存在的经典用法——比如平均数或者中位数等。那么空间分布模式,也可以有这种能力,就是通过一个指数来进行整体描述,这个指数,就是我们今天要说的莫兰指数(Moran‘s I)。

啥叫“指数”呢?我们在日常生活中,实际上也经常听到各种“指数”,比如新闻里面天天会播报的道琼斯指数:

小科普:道琼斯指数最早是在1884年由道琼斯公司的创始人查尔斯·亨利·道(Charles Henry Dow 1851-1902年)开始编制的一种算术平均股价指数

查尔斯·亨利·道

(Charles Henry Dow,1851-1902)

道琼斯指数发明者和道氏理论奠基者

纽约道·琼斯金融新闻服务的创始人

《华尔街日报》的创始人和首位编辑

道琼斯指数是世界上历史最为悠久的股票指数,它的全称为股票价格平均指数。这个指数历经百年,被认为是世界市场的晴雨表和金融的风向标。

因为人们无法记住和处理所有的细节,所以归纳就成为了人类的一种天赋技能,看见一件事情之后,会用很简单的一个字(词、句)来统合表达对整体的一个印象:

看着这样的场合,我们一般就会用一个词来进行表达:

你绝对不会说:

同样的,上一任米帝大统领参加三哥的阅兵式的时候,也没有发表长篇大论,而就是直接给出了一个字:赞!

所以,对于一票数据,我们首先也会给出一个综合性的评论。比如“这数据真尼玛的乱”。。。当然,这种评论更多是“定性”的,对于科学观测法来说,我们要给出一个量化的评定标准,所以就有了各种指数。

这个所谓的莫兰指数,就是用来衡量空间自相关的程度的一个综合性评价——特指全局莫兰指数。

那么为什么要叫做“莫兰”指数呢?(听起来特像个女生的名字),因为这个指数是以提出者的名字澳大利亚统计学家帕特里克·阿尔弗雷德·皮尔斯·莫兰(Patrick Alfred Pierce Moran)(好长的名字,不过一般都简称为:帕克·莫兰,就是下图这位中年帅哥了),在1950年提出的。

Patrick Alfred Pierce Moran

1917 - 1988

莫兰同学出生在澳大利亚,父亲是一位外科医生,他在自传中写道,自小对机械很感兴趣,但是超级不擅长数学……但是后来阴差阳错的读到了一本鸡汤小册子《The Great Mathematicians(伟大的数学家)》,然后下了一个决定:自己以后一定要成为一个伟大的数学家……

成年之后,莫兰先在悉尼大学攻读数学学位,后来前往剑桥大学深造,他一门心思想成为数学家的同时,被一位退休的教授告诉他”放弃吧,你不会成为数学家的“……而且他的父亲也希望他转学医学,好回去接班。

咬牙读下去的莫兰,在二年级考核的时候,33名同学中,名列第28名(倒数第五),到了第三年的时候,虽然莫兰拼死拼活总算通过了考试,但是他的导师实在看不下去了,直接说:

Ebenezer Cunningham(1881-1977)

剑桥圣约翰学院教授,著名数学家

莫兰同学当年的老板,上面那句劝他学医的忠告,是坎宁安教授的原话

不过我想,当年莫兰同学心里面肯定重复的是鲁迅的话:

——学医救不了XXX,但是数学阔以。

莫兰同学的命运在1939年被扭转了,第二次世界大战爆发,莫兰以技术人员的身份被征召进入了英国军情机构,从事武器科学研究,并且加入了负责火箭的弹道实验室,从事数据分析工作。

Projectile

Development 

Establishment

(P.D.E)

英格兰火箭研究中心

在莫兰的自传里面写到,整个实验团队里面,都是年轻数学家,而且不乏声名显赫之辈,自己这样一个数学学渣,在这里面搞得非常的尴尬,不过就在这个时候,一个友善而热情的年轻人,将吊车尾莫兰同学从尴尬中解救了出来……按照那些传奇故事里的说法,应该叫做“历史的车轮开始转动”——这个友善而热情的年轻人就是未来的著名统计学家Maurice Stevenson Bartlett。

莫兰同学的好基友和引路人:

Maurice Stevenson Bartlett

(1910-2002)

著名数学家和统计学家

英国皇家统计学会主席

英国皇家科学院院士

美国科学院外籍院士

两个好基友从此就过上了形影不离的生活……在巴特利特的影响下,莫兰觉得似乎统计学更加适合自己,特别是在弹道实验室里面,学渣莫兰不被允许参与更深层次的研究,只是被指派进行一些简单计算(在没有计算机的时代,所有的计算都是人工进行的,参看591工程里面的邓稼先项目组)。

镇国工程591

虽然后面还经历了很多波折,但是莫兰同学最后依然没有没有实现他的梦想,成为一个伟大的数学家,不过,阴差阳错的,他却成为了一个伟大的统计学家——他在1950年提出的莫兰指数,到现在为止,依然是空间统计学领域里面最具有权威性和指导性概念,依然是千千万万学习空间统计学和计量经济学的学子们所要面对的入门首战。

划重点:要考

1、数学不行,不代表你不能学好统计学,也不妨碍你成为一个伟大的统计学家

2、虽然说是数学不行(相对他的数学家同学们来说),但是莫兰同学好歹也是剑桥大学数学系研究生毕业的水平,所以,高等数学及格很重要。

3、一定要有个好的同学或者朋友或者引路人——比如关注虾神公众号。

言归正传:

那么莫兰指数这个东西是怎么出来的呢?战后,莫兰在牛津大学统计研究所找到了一份工作,有意思的是统计所正好在牛津大学的动物种群研究中心(The Oxford University Bureau of Animal Population)以及爱德华·格雷鸟类学研究所(the Edward Gray Institute of Ornithology)旁边。老去这两个研究所蹭饭的莫兰,在耳濡目染之下,突然对动物种群分布统计发生了浓厚的兴趣……为后来开启了空间统计学的研究打下了基础。

回到澳大利亚之后,莫兰同学就如同突然开挂一样,光芒四射(澳大利亚一个能打的都没有?),时年34岁的他,先是创办了澳大利亚国立大学统计学系,后来他又成为了澳大利亚统计学会的主席、澳大利亚科学院院士、英国皇家科学院院士以及获取了一堆数都数不清楚的荣誉……

莫兰:我超凶的!

不过这些对于他来说都不在重要,晚年患有严重抑郁症的他,终于在1988年,因为心脏病而告别了这个世界,被安葬在他的故乡堪培拉。但是他创立的澳大利亚国立统计研究所,到现在为止,还是世界上最著名的统计研究中心之一,也为世界培养了无数的一流统计学家。

莫兰奖章

澳大利亚最高专业学科奖之一

专门授予40岁以下,

在应用概率学、生物学、遗传学、数学和统计学上

做出杰出贡献的科学家。

莫兰同学的传奇经历暂时告一段落,我们也不是统计学史研究者,大家听个热闹就好了,下面我们最后花一点时间来讲讲莫兰指数的怎么被他提出来的。

前面说到莫兰在牛津大学的时候,因为老去动物种群研究中心和鸟类研究中心蹭饭(这个剧情是我脑补的,不要当真),所以耳濡目染之下,发现动物种群的分布似乎存在一些规律。比如有些动物是喜欢扎堆的,而有些动物时而扎堆,时而到处乱跑(随机),还有些动物有领地意识的会相互争斗,所以就想,有没有一种方法,按照动物出现的区域,来对动物的分布进行研究呢?

三种模式:

小强代表的聚集模式

游戏里面的野怪代表的随机模式

一山不容二虎的离散模式

所以在1950年,他出版来一本重要的著作“关于连续随机现象的解读“,正式提出来莫兰指数这个概念。那么这个概念到底说的是什么内容呢?他又有哪些意义呢?我们下回继续。

CSDN的被爬虫专用声明:虾神原创,公众号\\知乎:虾神说D

转发、转载和爬虫,请主动保留此声明。

 

以上是关于新版白话空间统计:莫兰指数之起源的主要内容,如果未能解决你的问题,请参考以下文章

白话空间统计之:Moran's I(莫兰指数)

新版白话空间统计:莫兰指数小结

新版白话空间统计:在ArcGIS中实现莫兰指数计算

新版白话空间统计(19)空间关系对莫兰指数的影响

新版白话空间统计(19)空间关系对莫兰指数的影响

新版白话空间统计(19)空间关系对莫兰指数的影响