[转载]新型肺炎疫情空间分析——聚类和异常值分析

Posted 虾神说D

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了[转载]新型肺炎疫情空间分析——聚类和异常值分析相关的知识,希望对你有一定的参考价值。

欢迎关注智图GeoQ公众号

——一个有智慧、高智商、高智力的位置服务提供者

上一篇文章《地图回溯新型肺炎疫情动态发展》,我们将各省市的疫情分布情况展示在地图上,为更好地观察疫情发展的规律,本文将1月23日-2月1日之间全国各地市确诊病例数据空间化制成聚类和异常分析动图,通过动图展示,清晰展现疫情发展的规律与聚集情况。

在制图时我们所使用的是ArcGIS中的聚类和异常值分析 (Anselin Local Moran's I) 工具,该工具可使用输入要素类中各要素的下列属性来创建新的输出要素类:local Moran's I 指数、z 得分、p 值和 COType,同时对 COType 字段进行渲染从而形成我们所看到的图。

其中z 得分和 p 值都是统计显著性的度量,可指明是表面相似性(高值或低值的空间聚类)还是表面相异性(空间异常值)比我们在随机分布中预期的更加明显。

p 值表示概率。对于模式分析工具来说,p 值表示所观测到的空间模式是由某一随机过程创建而成的概率。当 p 很小时,意味着所观测到的空间模式不太可能产生于随机过程(小概率事件)。

如果要素的 z 得分是一个较高的正值,则表示周围的要素拥有相似值(高值或低值)。如果要素的 z 得分是一个较低的负值(如,小于 -3.96),则表示有一个具有统计显著性的空间数据异常值,即为高值要素而四周围绕的是低值要素,或者是低值要素而四周围绕的是高值要素。

COType 字段将始终指明置信度为 95% 的统计显著性聚类和异常值。只有统计显著性要素在 COType 字段中具有值。该字段中值为HH即高值聚类、HL高值主要由低值围绕的异常值、LH即低值主要由高值围绕的异常值、LL即低值聚类;分别对应渲染图中对的图例High-High Cluster、High-Low Outlier、Low-High Outlier、Low-Low Cluster。我们可以用下面这张图形象的解释这四类特点。

注:图片引用自大虾卢在CSDN网站中的博客,博客链接地址:https://blog.csdn.net/allenlu2008/article/details/50674929

有兴趣的朋友可以移步链接查看虾神对聚类和异常值分析 (Anselin Local Moran's I) 工具的使用介绍。

聚类和异常值分析 (Anselin Local Moran's I) 工具的特点是可识别高值密度、低值密度和空间异常值,可在经济学、资源管理、生物地理学、政治地理学、疾病预防和人口统计等许多领域中应用此工具。

现在回归到我们的图中,武汉市作为疫情起源城市一直处于HH和HL状态,其周边城市由LH逐渐发展为HH,表明疫情还是有一定的聚集性,由武汉市逐步往周边城市扩散。且通过观察23日-25日这三天的变化情况,发现HH状态的城市增长速度较快。

图中有以下两点特殊:

_

北京市一直处于HL状态,说明其确诊病例一直处于高值,而北京周围确诊病例处于低值,主要是因为北京是全国很重要的交通枢纽,人流量很大。

_

兰州市、哈尔滨市、昆明市有短暂的时间段为HL,大多数时间段为LL,出现这种情况主要是确诊病例一直在变化,其自身城市确诊病例的增长速度比其他城市的增长速度要低很多,所以就变成了LL。

总体来说,疫情高发地起始于湖北省,并逐渐向周边省市扩散,到2月1日,疫情高发地集中在湖北省、湖南省、浙江省、安徽省、江西省等。

END

_

智图免费提供疫情地图服务

如果您有制作疫情相关地图需求,

智图免费提供技术支持,产品,服务,

共同战“疫”。

如需咨询,可添加GeoQ小助理

智图GeoQ是什么?戳下划线文字找到答案

智图GeoQ为何能登上《清华管理评论》

欢迎加入GeoQ位置智能技术交流群:470334855

有专业人士在线答疑制图方法哦!

_

以上是关于[转载]新型肺炎疫情空间分析——聚类和异常值分析的主要内容,如果未能解决你的问题,请参考以下文章

疫情数据可视化丨武汉回西安大学生聚餐后发病

陕西新型冠状肺炎病例数据可视化及分析

隔离是否有效?北大面向新冠疫情的数据可视化分析与模拟预测

Python | 新冠肺炎疫情数据的爬取与可视化分析

基于组合神经网络模型的新冠疫情传播预测分析

数据可视化项目--新型肺炎数据可视化分析二