Spark芝加哥犯罪数据分析与可视化
Posted colorfulday
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Spark芝加哥犯罪数据分析与可视化相关的知识,希望对你有一定的参考价值。
1、明确分析目标:多年来犯罪如何变化?是否有可能预测犯罪将在何时何地发生?在这段时间内,这个城市的哪些地区已经发生了变化?
2、针对以上目标,主要根据:犯罪时间 Date、犯罪类型 Primary Type 、逮捕情况 Arrest、犯罪地点 location_description(所属社区 community_area )等几列数据进行分析。
3、具体分析内容有:
- 近年来犯罪变化情况:每年的犯罪记录统计
- 犯罪频次最高的时段(几月,几点):按一年各月对比犯罪发生情况,按一日各小时统计犯罪发生情况
- 犯罪较多的类型:各类犯罪的总数对比,主要犯罪类型的每年变化情况
- 不同时段中频次最高的犯罪类型:按时段对不同犯罪类型做比较
- 哪些犯罪类型不易抓捕(危险类型):对比各类犯罪的逮捕情况
- 犯罪频次较高的犯罪地点:犯罪地点统计,犯罪社区统计
- 各地区的犯罪变化情况:各区每年总犯罪情况统计
- 犯罪地点与犯罪时间的关系:不同时间段犯罪频次最高地点,以及不同地点发生犯罪案件最多的时间段
- 各地区的犯罪变化情况:各区每年总犯罪情况统计
4、根据以上对数据的分析,可以得出关于芝加哥近年犯罪率的变化情况,以及各社区的安全系数,哪个时间段犯罪率较高,从而进一步分析,不同警区的逮捕犯罪情况,以及该警区管辖的社区犯罪频次,各地区的犯罪发生次数的增减与被捕情况的关系,等。
以上是关于Spark芝加哥犯罪数据分析与可视化的主要内容,如果未能解决你的问题,请参考以下文章
如何优化 google-bigquery 以从大数据表中查找最常见的类别?
R语言使用ggplot2包和maps包可视化美国地图使用北美犯罪率数据为不同区域的地图渲染(颜色深浅区分犯罪率高低US map colored by violent crime rates)