基于GIS与机器学习的健康户外跑路线评估与规划
Posted 易智瑞
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了基于GIS与机器学习的健康户外跑路线评估与规划相关的知识,希望对你有一定的参考价值。
机器学习,深度学习越来越多的应用在GIS领域,通过机器学习算法与GIS集成可在更短的时间内提供更好,更优的分析结果。今天与大家分享的是2020易智瑞杯中国大学生GIS开发竞赛·地理设计组的二等奖作品《基于GIS与机器学习的健康户外跑路线评估与规划》,作者单位:南通大学地理科学学院,小组成员:马培龙,高丽娜,王辰怡,陈均任,指导老师:周侗,陶菲。
1.1作品背景
1.2研究意义
1.街道级别的PM2.5分布数据可为跑友规划出空气质量最优的健康跑步路线,有效减少跑步过程中污染物的吸入量,最大化保障跑步过程中的身体健康,从而推进健康中国政策的有效实施。
2.精确的PM2.5空间分布估计有助于评估PM2.5空气污染的长期影响与变化特征,提升对PM2.5演变规律的认知,制定合理的污染控制政策,为我国未来的大气污染防治提供有价值的信息。
2.1技术路线
图1技术路线
2.2主要步骤
2.2.1数据获取与预处理
2.2.2模型训练与评估
2.2.3PM2.5反演
图2 气象数据示例
2.2.4路径规划
本研究的路径规划算法与Dijkstra算法相似,确定起止点,权重如上文的,即可规划出相对健康的路径。
图3 权重计算
3.1 模型对比
本作品使用Python机器学习包Sklearn进行模型构建,并使用其中的GridSearch模块进行参数寻优,运行系统为Windows 10,处理器为Intel Core i5-8300H,内存8G。根据决定系数R2确定最优模型。
图4 不同机器学习模型的预测效果
表1 不同模型的评价指标得分
3.2 PM2.5反演
得到某一区域连续的PM2.5分布情况,常用方法是对该区域的空气质量监测站点测得的PM2.5值进行空间插值,如图5中的a,c,是对站点监测值进行克里金插值计算所得,b,d则是使用的RF模型,a,b是2017年12月21日的分布情况,c,d是2019年4月15日的分布情况。由图可知,反演模型所估算出的杭州市两天的日均PM2.5分布情况总体趋势上与克里金插值的结果一致,但空气质量站点的分布极为不均衡,插值结果仅能反映整体的分布趋势,而反演结果的空间分辨率为30m,能够反映细致的PM2.5分布情况。
图5研究样区PM2.5反演结果
图6 道路PM2.5分布
3.3路径规划
本作品针对两种不同的户外跑情形提出了固定起始点与固定距离两种不同的路径规划方案。
3.3.1固定目的地
通过20组随机实验结果表明:①系统能够准确规划出起点与终点间的最短路径。②相比于最短路径,污染最小路径虽然在路程长度上略有增加,但却仍然在路径总污染浓度与平均污染浓度方面有所提升,总污染浓度降幅普遍位于5%-10%之间,平均污染浓度降幅普遍位于10%-20%之间,效果明显。
图7 最短路程与最低污染路程
3.3.2固定跑步距离
图8 最高污染路程与最低污染路程
1. 模型创新:综合考虑了地表物理特征(Landsat 8遥感影像),地面监测站点数据(气象数据与历史区域日均PM2.5数据)与社会经济条件(道路、工厂密度,GDP分布,人口分布)等多种影响要素,提升了反演模型输入要素的客观性与全面性,保障了反演的精度。
2. 方法创新:综合使用GIS、遥感、机器学习方法,实时计算出城市以及道路级别的空气质量分布情况。
3. 应用创新:基于空气质量为户外跑步人群规划出污染最低、最健康的路径,保障其户外跑步过程中的身体健康。
以上是关于基于GIS与机器学习的健康户外跑路线评估与规划的主要内容,如果未能解决你的问题,请参考以下文章