警务数据可视化分析

Posted 情报分析师

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了警务数据可视化分析相关的知识,希望对你有一定的参考价值。


警务数据可视化分析


情报分析师

全国警务人员和情报人员都在关注


【警务数据可视化技术可以把人脑难以处理的海量数据转换为易于感知的图像,利用人类感知与计算机系统的深度耦合,挖掘警务数据背后隐藏的信息与规律。本文在对警务数据可视化相关工作进行总结的基础上,对英国伦敦的犯罪数据进行了可视化分析和预测研究,并提出了警务数据可视化存在的问题与挑战。】


警务数据可视化分析


1 引言

传统的警务数据处理方式主要是以人工搜索查询和对比为主。进入大数据时代后,各种智能移动设备、传感器和社交网络不停地产生数以亿计的数据,数据结构也更加复杂[1],传统的警务数据处理方式难以有效应对,效率低下。数据可视化技术立足于人脑和机器的优势互补,是数据处理的一种新型方式,在很多领域被有效应用。运用数据可视化技术可以将人脑难以理解的海量数据转换成直观的图形或图像,然后利用人脑在图像识别上的优势,洞悉数据背后隐藏的关系、规律和趋势[2],同时发现数据中的异常点。本文介绍了警务数据可视化的相关工作,并分析了英国政府公开的犯罪数据集,最后提出了警务数据可视化存在的问题与挑战。


2 相关工作


运用空间分析及数理统计的方法可以得到地理环境、社会环境等相关因素对犯罪情况时空分布的影响程度[11-13]


采用地图或者社会网络分析等方式,可以辅助侦查人员确定犯罪模式,进行案件串并分析[14]。例如,利用三维地图可以对某个犯罪过程进行形象化展示,有利于揭示犯罪模式[15-16]。对社会网络进行交互式的可视化分析,有利于梳理犯罪人员之间的关系[17]。 


3 案例分析

本案例所采用的数据来自英国政府公开的犯罪数据集。根据研究的需要,本案例使用了伦敦警察厅 2016-2018 年的犯罪数据。原始数据集中存在空值、重复和错误的信息,需要进行预处理之后才能使用。


伦敦作为英国的首都,社会治安相对良好,犯罪率在全英处于较低水平。2016 年共发生 1330 起犯罪事件,2017 年共发生 1243 起犯罪事件,2018年共发生 1401 起犯罪事件,平均每年发生 1325 起,每月发生 110 起,每天发生 4 起。


如图 1 所示,2016-2018 年发生在伦敦的所有犯罪中,毒品犯罪最为严重,主要以青少年吸食毒品为主。占据第二位和第三位的犯罪类型是盗窃和抢劫,这与 2017 年伦敦警察厅声明停止调查级别较低的犯罪行为有关。


警务数据可视化分析

2 所示是伦敦 2016-2018 年平均每月和每天发生犯罪事件的热力图。从图中可以看出,犯罪事件较多地发生在 1 月、8 月和 9 月,每个月的高发时段呈现随机分布。如图 3 所示,星期二、星期四和星期五的犯罪数量相对较多,星期六和星期日的犯罪数量相对较少,而且休息日期间的犯罪主要集中在夜间和凌晨。犯罪热力图反映了不同的犯罪模式和罪犯的活动规律,可以为公安机关有效部署警力提供参考。


警务数据可视化分析

警务数据可视化分析

在此基础上,本文利用机器学习算法对犯罪类型进行了预测研究。考虑到不同犯罪类型之间数量差别较大,这里只选用图 1 中排名前三的犯罪类型进行研究,即毒品犯罪、盗窃和抢劫。本案例利用有监督学习的分类算法来预测犯罪类型。为了对比不同算法的性能,这里采用 K 近邻(K-Nearest Neighbor, KNN)和随机森林(Random Forest, RF)两种算法。首先,对数据集的不同属性进行哑变量编码,然后将数据集划分为训练集和测试集。训练过程采用相同的训练集分别对两种算法进行训练,之后采用相同的测试集分别进行测试。为了检验算法的稳定性,这里采用 5 折交叉验证。测试结果显示,KNN 算法的精度为 52.4%RF 算法的精度为58.1%。图 4 所示为 KNN 算法和 RF 算法的 ROC曲线。显然,RF 算法在本案例中的表现明显优于KNN 算法。


4 存在的问题与挑战

随着警务数据可视化方式被越来越多地采用,以及需要处理的信息不断增加,公安机关对可视化技术的需求也不断提高。警务技术可视化可以在以下方面进行更深入的研究。


1)现有的数据可视化技术主要针对结构化数据,但对视频、声音等非结构化数据缺乏有效的表达方式。同时,结构化数据与非结构化数据之间的融合,以及信息的有效提取有待进一步加强。 


2)现今,主要通过散点图矩阵或平行坐标图来展现高维警务数据之间的关系。但是,这两种编码方式受到展示空间的限制,随着维度的增加,信息传递效率会逐渐降低。所以,需要寻找更加有效的编码方式来适应高维度的情形。


3)已有的研究主要是对历史数据的研究,缺乏对流数据进行实时可视分析,这会降低数据的利用价值。所以,应该加强对流数据的实时分析,增强数据的时效性价值。


5 结论

本文利用KNN算法和RF算法对犯罪类型进行预测,结果显示 RF 算法在本案例中的表现明显优于 KNN 算法。




参考文献及英文摘要略

本文转自: 何巍,申华 .警务数据可视化分析[J].福建电脑,2020,06.

本期编辑:歪爱木

本文转载,如有侵权,请联系管理员删除



普及情报思维 传播情报文化

长 按 关 注


投稿邮箱】

550419913@qq.com


以上是关于警务数据可视化分析的主要内容,如果未能解决你的问题,请参考以下文章

智慧交管大数据可视化分析决策平台

数据可视化5个典型实例分析

图书请看!数据可视化设计指南:图表设计

警务大数据可视化平台建设方案

案例:警务大数据可视化平台建设方案

智慧警务大数据分析平台开发情报综合研判系统开发