python实训2
Posted 林木森3
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python实训2相关的知识,希望对你有一定的参考价值。
import pandas as pd # 餐饮数据 data = pd.read_excel(r"C:\\Users\\Minori\\Desktop\\python实训\\catering_sale.xls",index_col=u\'日期\') # 读取数据,指定“日期”列为索引列 print(data) print(data.describe(),data.describe().max()-data.describe().min()) import matplotlib.pyplot as plt # 导入图像库 plt.rcParams[\'font.sans-serif\'] = [\'SimHei\'] # 用来正常显示中文标签 plt.rcParams[\'axes.unicode_minus\'] = False # 用来正常显示负号 plt.figure() # 建立图像 p = data.boxplot(return_type=\'dict\') # 画箱线图,直接使用DataFrame的方法 x = p[\'fliers\'][0].get_xdata() # \'flies\'即为异常值的标签 y = p[\'fliers\'][0].get_ydata() y.sort() # 从小到大排序,该方法直接改变原对象 for i in range(len(x)): if i>0: plt.annotate(y[i], xy = (x[i],y[i]), xytext=(x[i]+0.05 -0.8/(y[i]-y[i-1]),y[i])) else: plt.annotate(y[i], xy = (x[i],y[i]), xytext=(x[i]+0.08,y[i])) plt.title(\'箱型图3127\',fontsize=20) plt.show() # 展示箱线图
import pandas as pd import numpy as np data = pd.read_excel(r"C:\\Users\\Minori\\Desktop\\python实训\\catering_sale.xls",names=[\'date\',\'sale\']) print(data.describe()) bins = [0,500,1000,1500,2000,2500,3000,3500,4000] labels = [\'A_lei\',\'[500,1000)\',\'[1000,1500)\',\'[1500,2000)\', \'[2000,2500)\',\'[2500,3000)\',\'[3000,3500)\',\'[3500,4000)\'] data[\'sale分层\'] = pd.cut(data.sale, bins, labels=labels) print(data) aggResult = data.groupby(\'sale分层\').agg(\'sale\':\'count\') print(aggResult) pAggResult = round(aggResult/aggResult.sum(), 2, ) import matplotlib.pyplot as plt plt.figure(figsize=(10,6)) # 设置图框大小尺寸 pAggResult[\'sale\'].plot(kind=\'bar\',width=0.8,fontsize=10) # 绘制频率直方图 plt.rcParams[\'font.sans-serif\'] = [\'SimHei\'] # 用来正常显示中文标签 plt.title(\'季度销售额频率分布直方图3127\',fontsize=20) plt.show()
import pandas as pd import matplotlib.pyplot as plt data = pd.read_excel(r"C:\\Users\\Minori\\Desktop\\python实训\\catering_dish_profit.xls") # 餐饮数据 x =data[\'盈利\'] labels = data[\'菜品名\'] plt.figure(figsize=(8,6)) plt.pie(x,labels=labels) plt.rcParams[\'font.sans-serif\'] = \'SimHei\' plt.title(\'菜品销售分布(饼图)3127\',fontsize=20) plt.axis(\'equal\') plt.show()
import pandas as pd import matplotlib.pyplot as plt data = pd.read_excel(r"C:\\Users\\Minori\\Desktop\\python实训\\catering_dish_profit.xls") # 餐饮数据 x=data[\'菜品名\'] y=data[\'盈利\'] plt.figure(figsize=(8,4)) plt.bar(x,y) plt.rcParams[\'font.sans-serif\']=\'SimHei\' plt.xlabel(\'菜品\') plt.ylabel(\'销量\') plt.title(\'菜品销售量分布(条形图)3127\',fontsize=20) plt.show()
#部门之间 import pandas as pd import matplotlib.pyplot as plt from pylab import mplmpl.rcParams[\'font.sans-serif\'] = [\'SimHei\'] data=pd.read_excel(r"C:\\Users\\Minori\\Desktop\\python实训\\dish_sale.xls") plt.figure(figsize=(8,4)) plt.plot(data[\'月份\'],data[\'A部门\'],color=\'green\',label=\'A部门\',marker=\'o\') plt.plot(data[\'月份\'],data[\'B部门\'],color=\'red\',label=\'B部门\',marker=\'s\') plt.plot(data[\'月份\'],data[\'C部门\'],color=\'skyblue\',label=\'C部门\',marker=\'x\') plt.legend() plt.ylabel(\'销售额(万元)\') plt.title(\'部门之间销售金额比较3127\',fontsize=20) plt.show()
import pandas as pd import matplotlib.pyplot as plt from pylab import mpl mpl.rcParams[\'font.sans-serif\'] = [\'SimHei\'] data=pd.read_excel(r"C:\\Users\\Minori\\Desktop\\python实训\\dish_sale_b.xls") plt.figure(figsize=(8,4)) plt.plot(data[\'月份\'],data[\'2012年\'],color=\'green\',label=\'2012年\',marker=\'o\') plt.plot(data[\'月份\'],data[\'2013年\'],color=\'red\',label=\'2013年\',marker=\'s\') plt.plot(data[\'月份\'],data[\'2014年\'],color=\'blue\',label=\'2014年\',marker=\'x\') plt.legend() plt.ylabel(\'销售额(万元)\') plt.title(\'B部门各年份之间销售金额的比较3104\',fontsize=20) plt.show()
暑假实训营之 Python爬虫技术
加入砺锋众创空间 IT 暑期实训营的营员将会获得:
★ 免费学习实用和最热门的 IT 技术知识,提高实践操作能力;
★ 获得职业规划指导和职场发展素质训练,获得企业颁发的社会实践实习证明;
★ 如果你成为相关营别的“优秀实训生”或“超越营员”,那么你还将获得砺锋众创空间公司为你准备的现金大奖和丰厚奖品;
★ 如果你还在为未来的职业迷茫,实训结束相信你能对未来的方向更加明确;
★ 如果你在实训营中表现出很好的水平和执着的兴趣,那么你有可能成为砺锋众创空间的一名全职或兼职互联网开发工程师;
★ 加入砺锋省众创空间,100%可以获得 10000元补贴,同时可以申请各项大学生创新创业补贴 与创新创业大赛,最高奖金可达 30 万元!
★ 实训证书与证明,积累学分,免试获得工信部证书,部分院校可抵学分
★ 如果你是编程的爱好者,如果你对互联网开发或 IT 运营管理有兴趣,欢迎你加入到 IT 公益实训营,让我们用学习的方式为中国 IT 梦添砖加瓦,和小伙伴们一起玩High IT!
砺锋暑假“筑梦计划”实训营内容
2019年暑假免费项目实训营:5天,6期,同期三大主题同步开营
7月15日,22日 ,29日;
8月7日,14日,21日,
暑假你可以有更好的选择!
住宿费用自理(可安排入住砺锋第三方宿舍,每天按 10 元收取),为了防止部分同学临时失约造成不便,我们会在报名时收取100 元押金,所以学完的同学正常退还。
主题:Python爬虫技术
爬虫是广州砺锋信息科技有限公司人工智能课程三大就业方向之一。2018 砺锋科技推出爬虫分布式,搜索引擎实现结合爬虫新技术,全面增强数据抓取和搜索技能。推出贴近企业实战的机器学习案例,例如人脸识别,股票数据爬取、数据抓取等项目实战。
实训目标:
本课程从开发环境的安装搭建开始进行讲解,结合学员管理系统 进行实操。主要教学内容如下:
1、通过 Python 基础数据类型和数据结构、函数和类、文件操作和模块导入、异常处理等知识点
的学习,轻松掌握 Python 编程的基础语法;
2、通过 json 数据和Python 数据类型的转化、爬虫基本理论和概念、requests 模块发送请求和
获取响应等知识点的学习,理解爬虫的基本原理,掌握简易爬虫的实现,完成数据的爬取,实现
海量数据的轻松获取。
课程内容
本课程与项目实战计划针对想入行 Python 的零基础学员精心录制。课程内容通俗易懂,知识点与案例穿插进行讲解,通过“12306 购票及教务系统抢课”的项目案例巩固学习成果。
课程大纲
第一天:初识 Python,了解爬虫
1.1 环境准备,Windows 或Ubuntu 系统的环境配置。
1.2 Windows 之 DOS 操作或Ubuntu 之 Terminal 操作
1.3 爬虫是什么?广度爬虫 VS 深度爬虫的选择
1.4 实战 Python,高效率使用PIP 安装 lxml 及 requests 模块库
1.5 实战爬取 lagou.com(拉勾网)及 ip138.com(IP 库)
1.6 作业(练习),爬取优酷网电影详情、片源等数据资源
第二天:爬虫基础知识加强,获取 12306 查询数据
2.1 应该花点时间讲下 XTML 和JSON 的基础知识
2.2 手把手分析网页规则,随心所欲爬取心仪的数据
2.3 12306 的站点分析,实战余票检测 再也不用受折磨
第三天:实战 12306 登陆,顺手写个教务系统规则
3.2 request 加强、BeautifulSoup 库使用入门
3.3 12306 有防爬策略?直接绕过。
3.4 爬虫数据干嘛用?该掌握利用数据来简单登陆啦。
第四天:实战 12306 购票及教务系统抢课
4.1 scrapy 框架很好用,商用爬虫必学之。
4.2 ip 被检测?selenium 代理IP 就搞定。
4.3 抢票抢课速度慢?多线程带你走向极致人生。
4.4 手动输入验证码?low,开始scrapy 验证码识别。
第五天:爬虫价值体现,项目部署可视化。
5.1 爬虫数据准备入库,Sqlite、Mysql 的基础学习
5.2 数据可视化,开发前端数据展示页面
5.3 杜绝代码,傻瓜式开启爬虫执行
学前基础要求: 零基础,可以没有任何编程基础
适合人群
1、有一定开发基础,希望通过学习Python突破技术瓶颈,获得高薪;
2、IT 从业者,想紧跟互联网趋势,学习前沿Python 技术,但不知道如何系统学习;
3、自制力较差,三天打鱼两天晒网,学习效率低,难以坚持;
4、正在学习 Python,遇到问题得不到及时解答,没有头绪;
5、在校大学生,希望充实自身技能;
6、犹豫中,不知道自己适不适合学习 Python;
7、紧跟编程发展脚步,仅仅想入门了解,零基础也可以参加。
砺锋筑梦计划咨询&报名通道
咨询老师:Linda 18922215502
或
扫描下方二维码
咨询&加入砺锋“筑梦计划”计划
砺锋筑梦计划助你收割
心仪Offer!
以上是关于python实训2的主要内容,如果未能解决你的问题,请参考以下文章