盛夏海边,用Python分析青岛哪些景点性价比高

Posted AI科技大本营

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了盛夏海边,用Python分析青岛哪些景点性价比高相关的知识,希望对你有一定的参考价值。

作者 | 志斌

来源 | 志斌的python笔记

头图 | 付费下载于 IC Photo

在经过几年的热潮之后,人工智能AI算法已经在各行各业广泛使用了。例如在工业制造中,利用人工智能监测仪器仪表、人员的违规与高危行为;利用图形AI算法进行材料质检;在能源、交通、农业等行业利用AI做智能可视化巡检;在金融领域基于人工智能的金融风控建模等等。

毕业了就肯定要计划毕业旅行的事情了,于是,志斌用Python爬取了去哪儿网上青岛景点的相关数据,包括景点名称、城区、热度、价格、月销量等数据,对数据进行可视化并作简单分析,用以找到性价比较高的景点。

数据采集

在之前的文章,我们已经详细的介绍了如何采集去哪儿网上的景点数据,不会的小伙伴可以看看这篇文章用Python分析西安景点,告诉你哪些景点性价比高。我们这里就不在详细介绍了,直接展示爬虫的核心代码:

import requests
from bs4 import BeautifulSoup
import openpyxl

for page in range(1,50):
 try:
     params = (
         ('from', 'mps_search_suggest_h'),
         ('keyword', '\\u897F\\u5B89'),
         ('page', str(page)),
     )
     response = requests.get('https://piao.qunar.com/ticket/list_%E8%A5%BF%E5%AE%89.html', headers=headers, params=params)
     soup = BeautifulSoup(response.text,'html.parser')
     zongs = soup.find_all('div',class_='sight_item')
     for i in zongs:
         name = i.find('h3').text
         diqu = i.find(class_='area').find('a').text
         redu = round(float(i.find(class_='product_star_level').text.split()[-1][:4]) * 5, 2)
      dizhi = re.findall('地址:(.*?)地图', i.find(class_='address color999').text)[0]
         jiage = float(i.find(class_='sight_item_price').find('em').text)
         yuexiao = int(i.find(class_='sight_item_sold-num').find('span').text)
         xingji = i.find(class_='level')
         jingweidu = i['data-point']

数据清洗

1、导入景点数据

用pandas读取爬取的景点数据并预览。

df = pd.read_excel('青岛景区数据.xlsx',names=['景点名称','城区','热度','地址','价格','月销量','月销额','星级','经度','纬度'])
print(df.head())


2、删除重复数据

网站中有一定的重复数据,需要将其删除。

df = df.drop_duplicates()

3、查看数据类型

查看字段类型和缺失值情况,符合分析需要,无需另做处理。

df.info()

可视化分析

我们来对这165个景点数据进行可视化分析。本次绘图使用的是Excel和Tableau两款软件。

1、景点介绍

通过对青岛景点介绍进行词云图绘制,我们很容易看出青岛的特点。建筑、度假、博物馆、帆船、休闲、世界等词的大量提及,说明青岛是一座非常适合度假的海滨城市,同时现代化也很强。

2、热度Top10景点

从景点评分来看,栈桥评分最高,5分满分。其次是崂山,是4.1分。怪不得一搜索青岛的旅游攻略,每一个里面都有这几个景点。

3、价格Top10景点

从景点价格来看,价格都在能接受的范围之内,大家可以根据自己的喜好去选择体验一下。

五月的风是五四广场的标志性建筑,我在百度上搜的是不收费的,但是不知道为什么在去哪儿网上给标注的收费。。。

4、月销量Top20景点

从门票月销量来看,极地海洋公园排第一,月销量2463,其次是海底世界和野生动物世界,分别是2372和2066。方特和啤酒博物馆也分别有1500+的销量。

看来青岛的海洋景点很受欢迎,同时青岛啤酒也是不可不尝的美食。

5、月销额Top20景点

从下图可以看出、月销额前四的分别是方特,307314;海底世界,284640;野生动物世界,169205;极地海洋公园,147780。

其他景点的月销额也基本上跟月销量排序差不多,看来月销额受到月销量和价格的影响相差不大。

6、景点分布

从图中我们可以看出景点主要集中在市南区和黄岛区,我们住宿的时候可以尽量选择住在这两个区,这样出行游玩会比较方便。

7、景点等级分布

从北京景点等级分布来看,3A以上等级的景点为29个,其中3A级景点13个,4A级景点15个,5A级景点1个。

总结

通过上面简单的分析,我们大致可以获得以下几点发现:

1. 青岛是一座现代化海滨城市。

2. 青岛的景点主要集中在市南区和黄岛区,我们住宿的时候可以尽量选择住在这两个区,这样出行游玩会比较方便。

3. 月销量最高的四个景点一定要去看看,毕竟大多数人的选择,质量肯定有保证。

4. 青岛的啤酒很好喝,身体条件允许的朋友,一定要来一杯尝尝。

温馨提示:疫情还未结束,外出旅行做好个人防护。尽量避免到中高风险地区游玩。

更多精彩推荐
赠书 | 读懂生成对抗神经网络 GAN,看这文就够了

搏一搏,单车变摩托!华为天才少年耗时四月将自行车强势升级为自动驾驶

基于微软开源深度学习算法,用 Python 实现图像和视频修复

点分享点收藏点点赞点在看

以上是关于盛夏海边,用Python分析青岛哪些景点性价比高的主要内容,如果未能解决你的问题,请参考以下文章

用Python爬取了全国近5000家旅游景点,分析元旦去哪玩

Python爬虫实战,携程旅游景点数据爬取,实现数据可视化

泰国哪里好玩?可以说说具体的景点吗?

Python高级应用程序设计任务

用数据揭晓,国庆最坑的旅游景点在哪里?哪些景点冷门却值得一去

一线城市的房租在工资中占比高吗?Python帮你分析