6000+个景点数据可视化,国庆出游避免拥挤,这一篇就够了!

Posted 顶级程序员

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了6000+个景点数据可视化,国庆出游避免拥挤,这一篇就够了!相关的知识,希望对你有一定的参考价值。


源 /  经管人学数据分析    文 / 胡萝卜酱

盼了那么久终于盼来了国庆7天长假,就问你们激不激动!

可是,出门游玩,走哪里都是人,人,人,人……。你的脑海里是否出现了以下画面:

6000+个景点数据可视化,国庆出游避免拥挤,这一篇就够了!

6000+个景点数据可视化,国庆出游避免拥挤,这一篇就够了!

6000+个景点数据可视化,国庆出游避免拥挤,这一篇就够了!

为了方便大家的出游选择,小编爬取了去哪儿网上面的6000多个景点数据,包含景点评级、热度、销量等等数据,汇总成这篇出游参考指南。

爬虫

爬虫继续用的是胡萝卜酱最近的心头爱selenium,打开去哪儿网站,右键,分析网页。

6000+个景点数据可视化,国庆出游避免拥挤,这一篇就够了!

我们需要的数据非常的清晰:

6000+个景点数据可视化,国庆出游避免拥挤,这一篇就够了!

话不多说,只要定位到自己想要的信息,那么代码非常简单。

 

本文仅爬取国内的数据,由于景点数据众多,每个省份仅取了前13页。获得景点个数6630个。

数据可视化

热门景区top30:

6000+个景点数据可视化,国庆出游避免拥挤,这一篇就够了!

大熊猫不愧为国宝,最热门就是它。其次是故宫,郑州动物园,峨眉山,秦始皇兵马俑等等。因为小编没有去过多少地方玩,也不知道为啥郑州动物园能排到第三,大家知道的可以告诉小编一下它的特色吗?

省份与评级:

6000+个景点数据可视化,国庆出游避免拥挤,这一篇就够了!

说实话,这个图的配色真的是太丑了,主要是小编过于懒惰,不想好好配色了6000+个景点数据可视化,国庆出游避免拥挤,这一篇就够了!

热力图:

热力图根据省份和城市分别作图,其次在根据销量和热度两类图,这里调用高德地图API完成。

首先是省份和景区热度:

6000+个景点数据可视化,国庆出游避免拥挤,这一篇就够了!

然后是省份和销量:

6000+个景点数据可视化,国庆出游避免拥挤,这一篇就够了!

接下来是城市和景区热度:

6000+个景点数据可视化,国庆出游避免拥挤,这一篇就够了!

最后是城市和景区销量:

6000+个景点数据可视化,国庆出游避免拥挤,这一篇就够了!

值得注意的是,城市和销量一图热力范围不明显,原因为景区之间销量天差地别,一些太少的的统计下来,作图非常的不明显了。若大家不喜欢用高德地图API作图,那么人生苦短,用pyecharts画图方法也非常适合做热力图,比如这里小编做了一张省份和销量的图:

6000+个景点数据可视化,国庆出游避免拥挤,这一篇就够了!

综合来看,北京,四川,沿海等地都是旅游的热门省份。建议大家尽量避免去这些省份游玩。

推荐景区:

知道了需要避免的景区和省份城市,那么可以去哪些人少的地方呢?这里胡萝卜酱根据景区分级,分别推荐15个人少的景区:

6000+个景点数据可视化,国庆出游避免拥挤,这一篇就够了!

6000+个景点数据可视化,国庆出游避免拥挤,这一篇就够了!

6000+个景点数据可视化,国庆出游避免拥挤,这一篇就够了!

最后两张图是根据热度做的图,没有条形的则是热度为0,那么大家可以选择上述景点中热度较高的进行游玩。

 可视化代码:

 

结语

爬虫采集于2018.9.27,可能因为采集时间不同,结果会有偏差。需要注意的是,若采用pyecharts做城市和景区热度、销量的图时,需要考虑pyecharts无法获得一些景区位置。

-END-

转载声明:本文选自「经管人学数据分析」。

长假无聊
不如来学Python
每天30分钟
30天学会Python编程

世界正在奖励坚持学习的人!

以上是关于6000+个景点数据可视化,国庆出游避免拥挤,这一篇就够了!的主要内容,如果未能解决你的问题,请参考以下文章

国庆出游神器:魔幻黑科技换天造物,让vlog秒变科幻大片!

国庆出游神器:魔幻黑科技换天造物,让vlog秒变科幻大片!

微信发布2017国庆长假出游情况大数据报告

盘点四大运营商的5G套餐亮点,国庆出游上车5G不用愁!

盘点四大运营商的5G套餐亮点,国庆出游上车5G不用愁!

HihoCoder1041 国庆出游 树形DP第四题