数据挖掘与机器学习——R语言数据分析与应用
Posted 人文社科新方法
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据挖掘与机器学习——R语言数据分析与应用相关的知识,希望对你有一定的参考价值。
无论何时开始学习都不晚!
大数据
数据挖掘
机器学习
R语言
01
大数据的发展如火如荼!
数据科学家已然成为各行各业的急需人才!
02
谷歌首席经济学家哈尔瓦里恩(HAL VARIAN)2009年在纽约时报撰文所说,“未来十年最性感的工作将是统计学家”,这里的统计学家是广义的统计学家,包括了数据科学家。
数据科学家职业被招聘网站Glassdoor在2016年被评选为美国最佳工作。
2019年全球企业至少需要100万数据科学家,大学培养的数据科学家数量远远不能满足市场需求,按照目前数据科学家的培养数量来看,这个缺口是很大的。
真正的数据科学家人才是比较短缺的!
03
R语言由新西兰奥克兰大学ross ihaka和robert gentleman 开发。R语言是自由软件,可以放心大胆地使用,且具有非常强大的统计分析和作图功能,而且更重要的是R软件具有非常丰富的网上资源,目前R软件有3000多种贡献包,几乎可以实现所有的统计方法,目前大部分的顶级统计学家和计量经济学家都使用R语言,而且越来越多的数据分析实务人员也开始使用R语言。R语言具有简单易学,功能强大,体积小(仅40m左右),完全免费,可自由开发等特点,且R语言和S语言语法基本相同,绝大部分程序是互相兼容的。学习R软件正成为一种趋势。
R软件最优美的地方是它能够修改很多前人编写的包的代码做各种你所需的事情,实际你是站在巨人的肩膀上。——Google首席经济学家Hal Varian
04
讲师介绍:
方匡南
厦门大学经济学院教授、博士生导师、耶鲁大学博士后
国际统计学会会士(ISI Elected member)
厦门大学数据挖掘研究中心副主任
两岸关系和平发展协同创新中心研究员
全国工业统计学会常务理事
厦门统计学会常务理事
入选福建省委组织部青年拔尖人才计划、福建省高校杰出青年科研人才培育计划、福建省高校新世纪优秀人才支持计划。 曾担任广发期货经纪有限公司研究员。台湾辅仁大学管理学院等访问学者。兼任国元保险等公司独立董事,中华数据挖掘协会(台湾) 顾问等职。
研究方向:数据挖掘、应用统计、健康医疗大数据、风险管理
曾先后发表论文70多篇,其中在 JMVA、Nature子刊 Scientific Reports、CSDA、Annals of Operation Research、Biometrical Journal等国际权威期刊发表30多篇,在《管理科学学报》、《经济研究》、《统计研究》、《数量经济技术经济研究》等国内权威期刊发表40多篇。多篇论文被中央编译局、改革论坛网、人大复印资料《社会保障制度》等全文转载。担任JASA、ANOR、《经济研究》、《管理科学学报》、Omega、Science China Mathematics 等期刊匿名评审人。出版专著和教材等6部,其中1部教材被引入台湾地区发行。先后主持了国家自然科学基金面上项目、青年项目、国家社科基金重大项目子课题、国家统计局重大项目等学术纵向课题10多项。
2007年出版了国内第一本R语言中文教程《R语言统计分析软件简明教程》,并于2015年2月出版了《R数据分析:方法与案例详解》,该书在同类书籍中销售名列前茅,并被引入到台湾地区出版。
有较丰富的数据挖掘实践经验,先后承担了华为、南方电网、华星光电、建行等30多项企业和政府数据挖掘项目,项目内容涉及互联网金融的大数据征信、智能制造中的数据挖掘、舆情分析与文本挖掘、深度学习与图像处理、景气指数预测预警等。
做了大量的统计和数据挖掘的应用推广工作,每年坚持开5-6次全国公开课和众多企业的技术内训,讲授《R机器学习》、《R数据挖掘》、《R数据分析》、《python机器学习》等课程,培训对象为国内外高校青年教师、研究生、业界数据挖掘工程师,每年培训500名左右技术人员。此外,为厦门大学、华南理工大学等MBA/EDP授课,推广在企事业单位实施数据化运营和管理的理念,每年为企业高管和政府官员培训4000人左右。
适合对象:
高校硕士生、博士生、青年教师;
金融、医疗、通讯、咨询、电子商务等领域的数据分析人员、数据挖掘工程师、数据科学家等。
章节目录:
一、数据挖掘与机器学习入门(一)
1、课前互动
2、国际上数据挖掘都在做什么?
3、国内数据挖掘典型案例分析
4、归纳问题(The Supervised learning )
5、归纳问题(The Unsupervised learning )
6、为什么要学习和使用R?
二、数据挖掘与机器学习入门(二)
7、为什么选择R及Rstudio?
8、R及Rstudio简介
三、初识R语言
9、生成有规则序列
10、向量的常见函数
11、矩阵及运算
12、数组、因子及列表
13、据框
14、数据的读入
四、作业解析
15、作业精解(1)
16、作业精解(2)
五、线性分类问题
17、分类问题概述
18、Logistic回归
19、极大似然估计
20、预测及实操
六、多元Logistic回归
21、多元Logistic
22、响应分类超过2的Logistic回归
23、线性判别分析
24、分类方法的比较
七、25、课堂习题
八、作业解析
26、作业解析(1)
27、作业解析(2)
九、线性模型和正则化(一)
28、子集选择法
29、逐步回归、向前逐步回归、向后逐步回归
30、选择最优模型
31、间接估计测试误差
32、直接估计测试误差:验证法和交叉验证法
十、33、线性模型和正则化(二):实操
十一、34、变量选择方法第一类:子集选择法
十二、35、变量选择方法第二类:压缩估计
十三、36、岭回归
十四、37、Lasso
38、Adaptive Lasso
39、结合案例实操
40、课堂练习
十五、课堂练习解析
41、课堂练习解析(一)
42、 如何自学寻找网络资源
43、课堂练习解析(二)
十六、基于树的回归和分类方法
44、基于案例理解决策树
45、建立回归树的过程
46、回归树案例解析
47、决策树归纳总结及实操
48、分类树、基尼系数
49、树的优缺点
十七、装袋法
50、改进决策树:装代法(自助法聚集)
51、装代法与决策树
十八、随机森林
52、随机森林的算法
53、随机森林案例分析及实操
54、答疑与总结归纳
报名方式
18章54小节,整整12小时课程
理论与实操相结合
易学不枯燥,让你轻松会
订阅后长期观看学习
原价49.9
长按二维码立即订阅学习
▽
注意事项
01
课程是如何更新的?
54个课程,已经全部更新完毕。
02
如果中途不想学了能退款吗?
抱歉,本课程为付费视频课程,一旦课程开始,无法提供退款,敬请谅解。
03
特别说明
视频版本归讲师和群学教育所有,视频不支持下载观看。
参考书目:
方匡南. 《R数据科学》.电子工业出版社.2018.3
方匡南 朱建平 姜叶飞. 《R数据分析—方法与案例详解.》 电子工业出版社.2015.2
方匡南. 《数据科学》. 电子工业出版社.2018.7
James G., Witten D., Hastie T., Tibshirani R. . An Introduction to Statistical Learning with Applications in R http://www-bcf.usc.edu/~gareth/ISL/
以上是关于数据挖掘与机器学习——R语言数据分析与应用的主要内容,如果未能解决你的问题,请参考以下文章