2016末班车:PYTHON数据挖掘-基于kaggle真实案例
Posted SOTON数据分析
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了2016末班车:PYTHON数据挖掘-基于kaggle真实案例相关的知识,希望对你有一定的参考价值。
优惠信息: 11月25号 ~ 12月3 号期间购买,立刻优惠50元~
不想阅读内容,可以直接点击左下角”阅读原文“购买~
数据分析目前是整个行业当中最紧缺也最炙手可热的的职位。各行各业,包括互联网,咨询,医疗,金融,通信甚至是房地产建筑,设计等这些传统公司都对数据分析师有着大量的需求。
市面上讲解python的课程很多,但大部分都是讲解基础语法或者程序设计与开发,很少有系统讲解python数据分析课程的。我们的课程设计围绕着实用主义这个概念出发,通过5个kaggle真实数据案列,讲解真实工作中经常会用到的数据分析技巧与方法。
如果你在工作或学习中还只能依靠EXCEL这样原始的工具来处理数据,那么你就需要仔细的考虑是是否需要自我提升,学习真正的数据分析技能了。我们的课程就是为了让你掌握工作或者学习中最常用的数据分析技能,让你告别EXCEL的繁琐操作。
讲师小明毕业于英国南安普顿大学理学硕士学位,目前就职业国内某互联网公司担任高级数据分析师。
五大真实案列数据教学:
1.《探索2016美国总统大选》
2.《IMDB 5000部电影大片数据分析》
3.《风靡全球的Pokemon游戏小精灵数据分析》
4.《2016希拉里邮件门数据挖掘》
5.《Uber在纽约接送客数据探索》
课程目标
课程全部基于kaggle真实案例而讲解,学完本科你至少可以掌握以下技能:
1. Python基础知识
2. Python在数据分析领域的应用
3. 真实工作案列的分析思路
4. 机器学习建模的初步理论与应用,能够自己独立完成建模项目
通过本课程的学习,同学们可以熟练掌握PYTHON在工作中的数据分析技能,灵活运用常用的数据分析数学知识去解决工作中遇到的问题。同时,最后的建模课程会让大家学会如何用高级模型去完成一个项目,告别『表哥表姐』的身份,成为一名合格的数据分析师。
适合对象
1. 在校大学生致力于毕业做数据分析的同学
2. 在职白领急需提升自己技能或者转让数据分析的同学
3. 任何想要深入学习数据分析或者对数据分析感兴趣的同学
介绍
本课程将由小明同学进行线上现场授课。
上课形式:YY视频直播,现场写代码。我们也会录制视频,课后会将课件,代码,视频发给大家再次学习。所有作业和项目都会进行详细讲解
上课时间:
时间进度表 |
||||
19:00 ~19:45 |
19:55 ~20:40 |
20:50 – 21:35 |
||
12月10号 |
第一课 |
第二课 |
第三课 |
|
12月11号 |
第四课 |
第五课 |
第六课 |
作业一 |
12月17号 |
第七课 |
第八课 |
第九课 |
|
12月18号 |
第十课 |
第十一课 |
第十二课 |
作业二 |
12月24号 |
第十三课 |
第十四课 |
第十五课 |
项目 |
课程时长:总共15节课程两次作业,三周讲完
参加这一期课程的同学免费获取上一期视频,并且可以免费参加下一期
课程支持windows,mac各种平台,请提前下载好YY并且注册I
了解PYTHON基础语法学习会顺利,没有也没关系
原价 750 元,会员八折优惠(600元)
11月25号 ~ 12月3 号期间购买,立刻优惠50元
前言部分我们会主要讲解以下知识点:
1. 什么是数据分析,为什么要学习数据分析
2. 如何高效学习数据分析
3. 目前发展的情况
基础语法
PYTHON入门,常用命令
PYTHON函数理解
PYTHON数据结构:列表,字典,元祖
切片与迭代
高阶函数:map,reduce
常用数据结构与数据操作
第一节课主要介绍最基础的PYTHON数据结构以及简单的数据IO技术。
1. 掌握字典,元祖,列表等常用结构
2. 掌握dataframe和series两种重要的数据结构
3. 学会如何从外部正确导入数据
4. 掌握常用的数据探索技术,比如特征类型,数据大小查询等
5. 变量重新命名,分类值频率,重复数据筛选等
:最核心的技能:索引选取
第二节课主要讲解pandas最核心的索引选取数据。索引操作几乎是数据框最常用最关键的技能,主要掌握:
1. Loc与iloc在索引操作上的区别
2. 多重条件选取
3. 根据条件创建新变量
案列分析:探索2016美国总统大选
:索性进阶:多重索引
本章节重点学习pandas的核心与难点:多重索引。这一节课建立在第二节课的基础之上,是对之前的课程进行的深入。主要讲解一下知识点:
1. 多重索引与单层索引的区别
2. 多重索引的核心操作
3. 深入理解pandas索引
案列分析: IMDB 5000部电影大片数据分析
:分组计算---数据分析最常用技能
本章节重点学习groupby的分组操作,通过学习能够掌握类似于excel透视表和切片一样的知识。
1. 数据的分裂:splitting
2. 数据的aggregation
3. 分组数据遍历
4. transformation
5. filteration
6. 其它有用的技能
案列分析: 风靡全球的Pokemon游戏小精灵数据分析
:多表组合---SQL操作
本节课学习多表操作,类似于我们重用的SQL语句。通过本章节学习,能够掌握以下内容
1. SQL常用语法的理解
2. Leftjoin , inner join ,right join 等常用技术
3. 理解Merge和join这两个最主要的函数
4. 解决最常遇到的一些问题
案列分析: 2016希拉里邮件门数据挖掘
:数据透视表与可视化
这一课我们主要讲解数据透视表以及数据可视化,会涉及到以下几个知识
1. 数据透视表
2. Pandas绘图
3. Matplotlib绘图
4. 统计分析
案列分析:Uber在纽约接送客数据探索
第六节课结束后会有一次作业,同学们需要根据作业要求完成对应的数据操作,包括条件筛选和可视化等。数据会在发到大家的邮箱,请大家务必按时完成。
:机器学习概论
这一节主要讲解的知识是机器学习的常用概念,包括
1. 监督与非监督学习
2. 模型的优化目标
3. 模型评估与模型选择
4. 正则化与交叉验证
5. 模型泛华能力
:机器学习常用算法学习(一)
本节会主要讲解具体的模型算法,主要是知道大家如何正确的使用模型。
1. 数据预处理,包括分类变量处理,NA处理,标准化处理
2. 监督与非监督学习
3. 模型的优化目标
4. 模型评估与模型选择
5. 正则化与交叉验证
:机器学习常用算法学习(二)
1. 代价函数
2. 机器学习核心算法:梯度下降
3. 极大似然估计算法
4. Logisticregression 算法
5. SVM算法
6. Sklearn中实现
:模型评估与选择
本课讲解建模后的工作,包括以下几个内容
1. 如何评价模型(分类和连续)
2. 如何选择参数
3. sklearn中实现上述理论知识
4. 课程总结
的核心操作
着重讲解numpy在机器学习中的数组表示方法,能够掌握并且运用numpy进行数值与统计分析
1. 多维数组的理解
2. 数组操作
3. 数组切片
4. 数组计算
:scipy科学计算
Stats模块讲解
优化方式的应用
:matplotlib 绘图操作
Python数据分析常用绘图
颜色,注释,legend等修改
多个图形的组合
第二次作业会是一个小小的project。同学们需要根据要求自己独立的完成数据的抽取,转换,处理以及建模等工作。最后按照准确率进行排名,前3名同学将会获得赠书!
购买方式:
淘宝搜索: soton数据分析
https://item.taobao.com/item.htm?spm=a1z10.1-c.w5003-15333719223.12.lAFqw5&id=530555437751&scene=taobao_shop
https://weidian.com/item.html?itemID=1835478507
或者点击左下角“阅读原文”
以上是关于2016末班车:PYTHON数据挖掘-基于kaggle真实案例的主要内容,如果未能解决你的问题,请参考以下文章