长沙旅游攻略!用Python告诉你31块的臭豆腐它香吗?
Posted 梦子Python7762
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了长沙旅游攻略!用Python告诉你31块的臭豆腐它香吗?相关的知识,希望对你有一定的参考价值。
回复“书籍”即可获赠Python从入门到进阶共10本电子书
今
日
鸡
汤
夜阑卧听风吹雨,铁马冰河入梦来。
五一去长沙吃喝玩乐
前几天发表过一篇文章厦门不止鼓浪屿,得到了一些朋友的肯定,让我再写下其他城市。这两天又获取到了两份关于长沙的数据:长沙景点和长沙美食,之后进行了分析,如果有朋友想去长沙或者周边城市玩,要仔细看看喔。所以想学的同学,有必要听一下这位老师的课、领取python福利奥,想学的同学可以到梦子老师的围鑫(同音):前排的是:762,中间一排是:459,后排的一组是:510 ,把以上三组字母按照顺序组合起来即可她会安排学习的。
导入库
长沙景点
数据获取
长沙景点的数据获取方法和之前那篇关于厦门的文章是一样的,只是重新跑了一遍代码,具体过程不再阐述,感兴趣的朋友可以看之前的文章,爬取的字段:
中文名
英文名
攻略数
评价数
位置
排名
驴友占比
简介
具体的源代码如下:
最终数据有1152条,数据中绝大部分是长沙的景点数据,也有少量少量周边城市,比如:宁乡、浏阳等的数据,整体的数据前5行如下:
下面重点介绍数据分析的过程
整体情况
首先看看整体的数据情况:
很显然:橘子洲、岳麓山、岳麓书院、太平老街排名靠前
排名靠前景点
看看排名靠前的景点是哪些?
通过排名我们发现:橘子洲(烟火、大桥、天心阁)、岳麓山(书院)、黄兴路步行街、马王堆汉墓遗址、湖南省博物馆,整体排名很靠前,深受游客们欢迎,具体看看排名前20的景点:
评论火爆景点
很多游客到了一个景点喜欢写评论,看下哪些景点获得大量的评论:
攻略在手,旅游不愁
出门旅游之前最好还是做一份旅游攻略,看看提供攻略最多的前10景点是哪些:
如果我们考虑前20个景点的攻略数:
驴友占比
我们爬取到的驴友数据是百分比,类型是字符串类型,我们现在去掉%符号,取出左边的数值,如果没有则用0代替,方便最终画图,具体操作如下:
取出排名前10的驴友占比景点:
景点介绍
获取到的abstract字段是用来描述景点的基本信息,可以用来制作词云图,具体处理过程如下:
长沙美食
第二部分介绍的是长沙(附近部分长沙)的美食,接下来从3个方面介绍:
字段获取
数据保存及处理
美食数据分析
发送请求
字段获取
名称cn_title
评分socre
均价person_avg
地址address
推荐菜recommand
评价comment
1、源码结构
网页显示每页有10个景点(最后页未必是10个),总共200页的数据,每个景点的信息包括在一个标签对中,我们只需要从标签中获取到相应的信息即可
2、名称和评分两个字段的获取相对简单,直接通过正则表达式来获取,关键字定位需要准确(以后会详细详解正则表达式的使用)
3、关于剩下4个字段的获取,相对复杂。因为他们并不是在每个店的信息中存在,有的,但是他们有一个共同点:全部是隐藏一个标签对中,而且每个字段都有自己的关键词.所以想学的同学,有必要听一下这位老师的课、领取python福利奥,想学的同学可以到梦子老师的围鑫(同音):前排的是:762,中间一排是:459,后排的一组是:510 ,把以上三组字母按照顺序组合起来即可她会安排学习的。
具体处理方法:先大后小
1、先整体:提取下面的全部信息
2、从步骤1的信息进行判断,获取4个单独字段
剩下3个字段处理类似:
4、上面是获取单页数据的解析过程,下面讲解如何获取200页的字段数据:
获取全网数据
5、提取到每个字段后生成整体数据,并保存:
美食数据分析
前期处理
在进行数据分析之前,需要进行前期的处理:
改变两字字段的数据类型:
长沙到底有几家文和友?
1、文和友是长沙的知名老店,那获取到的数据中有几家和文和友相关的店?
数据显示:20家
看看前5家:
2、哪家文和友得分最高?
我们看看前5名:
可以看到:府中路的这家店是评分最高的,网友给的评价是:
虾肉很新鲜,口感嫩滑,入味极佳,个人觉得不是很辣,但是如果对于吃辣程度一般的人来说,绝对足够了。所以想学的同学,有必要听一下这位老师的课、领取python福利奥,想学的同学可以到梦子老师的围鑫(同音):前排的是:762,中间一排是:459,后排的一组是:510 ,把以上三组字母按照顺序组合起来即可她会安排学习的。
臭豆腐香不香?
1、看看数据中有臭豆腐店
数据显示有19家,我们看看前5家店
2、臭豆腐的价格如何?
太平街21号的一份臭豆腐31块?不知道香不香!!!
3、整体臭豆腐店的分布,基于得分和均价两个字段
茶颜悦色好喝吗?
1、数据中几家茶颜悦色的店?
数据显示是10家,但是我想长沙肯定是不止10家!!!数据量还是太少了
2、茶颜悦色价格如何?
筛选出价格大于0的,我们:茶颜悦色的价格基本在17元左右
湖南人爱嗦粉
湖南人非常喜欢吃粉,尤其是常德的米粉非常出名
1、看看数据中有几家粉店?
数据显示有103家!!!果然湖南人爱嗦粉
2、查看得分排名前10的粉店
排名靠前的10位店价格基本上控制在14-15左右
3、米粉店整体分布
4、店铺汇总
另外,查看数据发现,还有15家酒吧,28家火锅店,我们汇总下。数据量过少,仅供参考
网友推荐菜
对于网友的推荐菜,采用词云图展示:
总结
文章通过对两份数据获取和分析,数据量并不大,但还是想到长沙旅游的朋友几点建议:
1、橘子洲你应该去看看
从长沙景点数据分析中看出来,不管是整体排名、游客提供的攻略数、评论数,橘子洲都是排名第一的,可以在橘子洲大桥看烟火
2、五一广场真的很热门
五一广场整个片区很多吃喝玩乐的地方:太平老街、火宫殿、黄兴路步行街等,爱吃爱玩的你应该去
3、博物馆和遗址
如果喜欢历史,可以去湖南省博物馆、马王堆汉墓遗、长沙简牍博物馆址逛逛
4、不怕辣就吃龙虾
喜欢吃小龙虾的就去文和友吧,口味挺齐全的。推荐:海信广场店
5、一定要尝下湖南米粉
上面的数据已经显示了,大大小小的粉店在长沙太多了,到了长沙务必尝下,推荐:原味粉店家
一切看似逝去的,都不曾离开,你所给与的爱与温暖,让我执着地守护着这里。
-------------------End-------------------
小可爱,加下我微信:762459510
领取以下福利
1、python安装包
2、程序员电子书籍:5本-10本
3、python项目源码三份:(python破解WiFi密码、VIP视频权限破解、爬虫自动化)
4、基础学习PPT教案
5、免费课程(开课时间15:00、19:30、20:30)自由选择
6、程序员职业规划分享
7、空余时间接单赚钱方法
以上是关于长沙旅游攻略!用Python告诉你31块的臭豆腐它香吗?的主要内容,如果未能解决你的问题,请参考以下文章
Python 爬取 13 个旅游城市,告诉你五一大家最爱去哪玩?