6000+个景点数据可视化,国庆出游避免拥挤,这一篇就够了!
Posted 顶级程序员
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了6000+个景点数据可视化,国庆出游避免拥挤,这一篇就够了!相关的知识,希望对你有一定的参考价值。
源 / 经管人学数据分析 文 / 胡萝卜酱
盼了那么久终于盼来了国庆7天长假,就问你们激不激动!
可是,出门游玩,走哪里都是人,人,人,人……。你的脑海里是否出现了以下画面:
为了方便大家的出游选择,小编爬取了去哪儿网上面的6000多个景点数据,包含景点评级、热度、销量等等数据,汇总成这篇出游参考指南。
爬虫
爬虫继续用的是胡萝卜酱最近的心头爱selenium,打开去哪儿网站,右键,分析网页。
我们需要的数据非常的清晰:
话不多说,只要定位到自己想要的信息,那么代码非常简单。
本文仅爬取国内的数据,由于景点数据众多,每个省份仅取了前13页。获得景点个数6630个。
数据可视化
热门景区top30:
大熊猫不愧为国宝,最热门就是它。其次是故宫,郑州动物园,峨眉山,秦始皇兵马俑等等。因为小编没有去过多少地方玩,也不知道为啥郑州动物园能排到第三,大家知道的可以告诉小编一下它的特色吗?
省份与评级:
说实话,这个图的配色真的是太丑了,主要是小编过于懒惰,不想好好配色了。
热力图:
热力图根据省份和城市分别作图,其次在根据销量和热度两类图,这里调用高德地图API完成。
首先是省份和景区热度:
然后是省份和销量:
接下来是城市和景区热度:
最后是城市和景区销量:
值得注意的是,城市和销量一图热力范围不明显,原因为景区之间销量天差地别,一些太少的的统计下来,作图非常的不明显了。若大家不喜欢用高德地图API作图,那么人生苦短,用pyecharts画图的方法也非常适合做热力图,比如这里小编做了一张省份和销量的图:
综合来看,北京,四川,沿海等地都是旅游的热门省份。建议大家尽量避免去这些省份游玩。
推荐景区:
知道了需要避免的景区和省份城市,那么可以去哪些人少的地方呢?这里胡萝卜酱根据景区分级,分别推荐15个人少的景区:
最后两张图是根据热度做的图,没有条形的则是热度为0,那么大家可以选择上述景点中热度较高的进行游玩。
可视化代码:
结语
爬虫采集于2018.9.27,可能因为采集时间不同,结果会有偏差。需要注意的是,若采用pyecharts做城市和景区热度、销量的图时,需要考虑pyecharts无法获得一些景区位置。
-END-
转载声明:本文选自「经管人学数据分析」。
长假无聊
不如来学Python
每天30分钟
30天学会Python编程
世界正在奖励坚持学习的人!
以上是关于6000+个景点数据可视化,国庆出游避免拥挤,这一篇就够了!的主要内容,如果未能解决你的问题,请参考以下文章