R语言数据挖掘初高级8月5日6日上海开班

Posted 经管之家

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了R语言数据挖掘初高级8月5日6日上海开班相关的知识,希望对你有一定的参考价值。

R的优点有哪些呢?

免费...开源...

是专门为统计和数据分析开发的语言

语言简单易学。

小...

同各种OS的兼容性好

各种包和函数的透明性极好,这使得对函数的调整和改良变得非常便利。

漂亮又灵活的图。




R语言数据挖掘现场班
通过案例掌握R语言数据挖掘

通过案例掌握R语言数据挖掘

时间:2016年8月5-8日(四天)

地点:上海市南京东路培训教室

安排:上午9:00-12:00;下午1:30-4:30;答疑4:30-5:00

费用:4500元/3600元(凭学生证优惠价)

(食宿自理)

教学大纲:

第一讲:R语言精要

本着循序渐进而又覆盖R语言重要而有用的基本内容原则,本讲从R语言入门开始,以前期的数据处理为核心,以实际案例为载体,内容包括R语言的向量、数据框、矩阵运算、缺失值和零值的处理、特别注重用R语言构造函数编程解决实际问题,详细介绍强大的数据清洗整理plyr、zoo、car等常用包和强大的作图ggplot2包,为使用R语言进行数据挖掘打下扎实的工具基础。

主要案例:

案例1:如何用R语言plyr等包合并、排序、分析数据并编制香农-威纳指数;

案例2:如何用R语言编程同时实现几十个高难度数据分析可视化图片的jpeg格式输出;

案例3:如何使用R语言进行分层或者整群抽样构建训练集与测试集;

案例4:使用ggplot2画出各种复杂的图形。

第二讲:Logistic回归与商业大数据建模

Logistic回归是商业建模的常用重要数据挖掘方法,本讲要讲清楚Logistic回归的建模原理、与多元线性模型的区别、R语言实现过程及回归诊断注意事项、预测方法和结果解释,让学员彻底地掌握Logistic回归解决问题的R语言方法。

主要案例:

案例1:利用Logistic回归帮助商业银行完成对客户提前还贷款情况的预测;

案例2:利用Logistic回归帮助医生对病人选择最佳治疗方案;

案例3:利用Logistic回归帮助厂家分析顾客做出购买决策的重要因素;

案例4:利用Logistic回归帮助寿险公司进行目标客户精准电话营销;

案例5:利用Logistic回归帮助商业银行完成对客户的信用评分;

案例6:利用Logistic回归帮助公司分析客户流失的原因并做好预测。

第三讲:关联规则和R语言实现

关联规则(著名的“啤酒和尿布”)是数据挖掘的基础和核心技术之一,本讲将着重围绕经典的Apriori算法和eclat算法,阐明关联规则的支持、置信和提升程度与控制,使用R语言快速完成关联规则分析。

主要案例:

案例1:使用R语言关联规则方法帮助各个超市实现商品的最佳捆绑销售方案(即“购物篮”分析);

案例2:泰坦尼克号乘客幸存的关联规则分析;

案例3:提高个人收入的关联分析。

第四讲:决策树(回归树)分析和R语言实现

决策树是数据挖掘的经典方法,其原理容易被理解。本讲主要讲授两种最为普遍的决策树算法:CART和C4.5算法,使用rpart和J48函数进行R语言分析。

主要案例:

案例1:对汽车耗油量进行决策树分析并完成相关目标变量的预测;

案例2:使用决策树帮助电信局判断和预测客户办理宽带业务。

第五讲:机器集成学习的Bagging和AdaBoost算法

这两种方法将许多分类器的预测结果进行汇总分析,从而达到显著提升分类效果。本讲介绍这2种算法的思想,在R语言中构造训练集和测试集进一步进行分析。

主要案例:
案例1:用R语言的Bagging和AdaBoost进行商业银行定期存款的分析和预测;

案例2:用R语言的Bagging和AdaBoost识别有毒蘑菇。

第六讲:R语言随机森林(RandomForest)算法

在机器学习中,随机森林是一个包含多个决策树的分类器,本讲讲清随机森林方法的原理,以致在实际中帮助学员判断适合进行随机森林分析的情况,最终熟练掌握R语言随机森林分析的方法。

主要案例:
案例1:对皮肤病进行随机森林的分类和预测;

案例2:对酒的品质和种类进行分类和评价。

第七讲:支持向量机和R语言的实现

本讲将分析支持向量机的结构风险最小原理、间隔和核函数,从而帮助学员深刻理解支持向量机的思想和算法,以及使用中注意的问题,从而帮助学员灵活地应用于各个领域。

主要案例:
案例1:对著名的鸢尾花数据进行支持向量机的分析;

案例2:使用支持向量机识别有毒蘑菇;

案例3:使用支持向量机进行股票指数预测。

第八讲:神经网络和R语言的实现

神经网络由大量的节点和输出函数构成逻辑策略,本讲介绍其原理,主要通过案例的方式讲解R语言实现神经网络算法的过程和注意的事项。

主要案例:
案例1:酒的品质和种类的神经网络的分析和预测;

案例2:公司财务预警建模。

第九讲:交叉验证比较各个模型

对于同一个数据,可能有很多模型来拟合,如何衡量和比较模型的精度呢?本讲将介绍交叉验证训练集和测试集的方法来帮助大家在实际中选取最佳模型进行拟合和预测。

第十讲:使用R语言结合KNN算法进行文本挖掘

文本挖掘,特别是对中文的文本挖掘日趋重要。本讲介绍文本挖掘的原理和方法,帮助大家使用R语言在大量的非结构化的数据中发现有价值的信息,抽取潜在有用的数据,发现适合模式,实现可视化结果展示。

主要案例:
案例:使用R语言结合KNN算法对网页(Web)进行文本挖掘(含分词、分类、可视化等)

从零基础掌握R语言—R基础+高级

时间:2016年8月6-8日初级;8月10-12日高级(共六天)

地点:上海市南京东路培训教室

费用:

初级:2700元/2200元(凭全日制学生证优惠价)

高级:3000元/2400元(凭全日制学生证优惠价)

全程:5400元/4400元(凭全日制学生证优惠价)

(食宿自理)

安排:上午9:00-12:00;下午1:30-4:30;答疑4:30-5:00


培训内容目录:

【初级班】


专题名称

                          授课内容


1

3小时)

R语言入门与基本数据分析


课程目标:掌握R语言的基本用法和基本数据分析

1.R语言介绍

2.编辑软件Rstudio使用

3.R程序包的载入与使用

4.数据对象及运算(向量、矩阵、数组、列表与数据框处理)


第2讲 

 3小时)

数据读入、读出与R基本编程


课程目标:掌握用R编写函数和对实际数据描述统计分析

1. R数据读入与读出 (读入txt、xls、SPSS、SAS、stata以及数据库文件)

2.R 函数编写

3.R的条件与循环函数

4.高效编程技巧介绍

5.利用R做迭代优化求解


第3讲

(3小时)

数据预处理与统计模拟


1. 数据预处理

2. 缺失值处理

3. 随机数生成

4. 常用统计方法的蒙特卡洛模拟

5. 随机抽样

案例:蒙特卡罗模拟的应用


第4讲

(3小时)

探索性分析与作图


1.单变量数据分析与作图

2.双变量数据分析与作图(列联表)

3.多变量数据分析与作图(多变量相关系数矩阵  )

案例分析:

1.统计作图在调查数据中的应用

2.统计作图在临床医学中的应用


第5讲

(3小时)

线性回归


课程目标:掌握线性回归方法与实际的建模分析

1. 一元线性回归

2. 多元线性回归

3. 逐步回归

案例分析:中国税收收入增长案例分析


第6讲 

3小时)

Logistic回归



课程目标:掌握logit模型、probit模型和决策树方法以及在信用卡违约预测的应用

1. LPM模型

2. Probit模型

3. Logit模型

案例分析:

1. 新教学方法的效果

2. 信用卡违约预测


【高级班】


专题名称

授课内容


1 

 3小时)

Poisson回归

分位数回归


课程目标:掌握poisson回归模型以及分位数回归在收入分配中的应用

1.Poisson回归模型

2.分位数回归模型

案例:

1.轮船事故的计数数据模型

2.医疗需求的poisson回归模型

3.恩格尔定律的分位数回归

4.社会保障对家庭消费影响


2

3小时)

聚类分析

分类分析


课程目标:掌握数据挖掘中常用的聚类和分类方法及其实际应用。

1.系统聚类分析

2.K-means聚类分析

3.决策树分析

4.随机森林分析

案例:

1.信用卡违约预测

2.银行贷款违约预测


3

3小时)

主成分分析

因子分析


课程目标:掌握数据挖掘中常用的主成分分析与因子分析及其实际应用。

1.主成分分析

2.因子分析

案例:主成分在综合评价中的应用


4

3小时)

变量选择与高维数据


课程目标:掌握数据挖掘中高维数据分析方法及其实际应用。

1.LASSO

2.SCAD

3.MCP

4.Group  LASSO

案例:

1.基因筛选

2.股票选股


5

3小时)

关联规则

高级作图方法


课程目标:掌握大数据分析中常用的关联规则方法及其实际中的应用。

1.关联规则方法

2.Aprior算法

3.高级作图方法 ggplot2

案例:超市购物篮分析


6

3小时)

社交网络分析

互动交流讨论


课程目标:掌握大数据分析中常用的社交网络分析方法及其实际中的应用。

4.无向社交网络的构建

5.加权社网络的构建

6.社交网络的图像展示

案例:股票市场社交网络分析


报名流程:

1:点击阅读原文中的“我要报名”,网上填写信息提交

2:给予反馈,确认报名信息

3:网上订单缴费

4:开课前一周发送课程电子版讲义,软件准备及交通住宿指南

联系方式:

魏老师

QQ:2881989714

Mail:vip@pinggu.org

Tel:010-68478566

报名链接:点击“阅读原文


以上是关于R语言数据挖掘初高级8月5日6日上海开班的主要内容,如果未能解决你的问题,请参考以下文章

AI晓学-C/C++编程班开班啦!

上海Cloudera Hadoop大数据培训:CCAHCCP:DE

HBase终于找到好老师了!《HBase进阶》第一期, 搜狗刘俊宏主讲,9月22日开班

医药加R语言数据分析实战技术(网络)研讨会(8月1-2日)

BDFF 2017大数据金融论坛8月23-24日上海举行!

Python和R数据挖掘分析技术高级公开课在上海举行