R语言+数据挖掘合璧,剑指商业应用

Posted 经管之家

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了R语言+数据挖掘合璧,剑指商业应用相关的知识,希望对你有一定的参考价值。

什么是数据挖掘?什么是机器学习?机器学习如何在商业中有效应用?


像人类一样,我们原本是透过观察习得经验值, 计算机的学习过程就是从数据中推导规则,机器学习说穿了, 其实就是让计算机从数据中归纳出规则。机器学习发展至今也过了好几个年头, 他不是新技术, 因为大数据和云计算的兴起,最近又火红了起来。


机器学习可以分为两大类,三种问题。


两大类分别是监督式学习与无监督式学习,听起来有点拗口,但区别就在于一个是根据有历史答案的资料进行学习。而监督式学习又可以根据预测的响应型态分为回归分析与分类问题。回归分析是用做连续型数字或二元数据的预测, 因此像是房价, 股价的预测, 都可以使用回归分析来建立预测模型。而相对于回归分析的问题即是分类问题,该问题的主要目标就是要预测类别数据, 因此当要预测的响应是类别数据(股市涨跌, 顾客是否流失)就可以用这种方法产生预测模型。无监督式学习是没有因变量的情况下使用聚类方法做分析,如客户聚类。


在学习数据挖掘之前你需要明了的几点:


  • 数据挖掘目前在中国的尚未流行开,犹如屠龙之技;

  • 据挖掘本身融合了统计学、数据库、机器学习、模式识别、知识发现等学科,并不是新的技术。

  • 数据挖掘之所以能够应用不是因为算法,算法是以前就有的。数据挖掘应用的原因是大数据和云计算。比如阿尔法狗的后台有上千台计算机同时运行神经网络算法;

  • 数据初期的准备工作,也称Data Warehousing。通常占整个数据挖掘项目工作量的70%左右。在前期你需要做大量的数据清洗和字段扩充的工作。数据挖掘和报告展现只占30%左右;

  • 数据挖掘技术更适合业务人员学习(相比技术人员学习业务来的更高效)


二、目前国内的数据挖掘人员工作领域大致可分为三类。


  • 1)数据分析师:在拥有行业数据的电商、金融、电信、咨询等行业里做业务咨询,商务智能,出分析报告;

  • 2)数据挖掘工程师:在多媒体、电商、搜索、社交等大数据相关行业里做机器学习算法实现和分析;

  • 3)科学研究方向:在高校、科研单位、企业研究院等高大上科研机构研究新算法效率改进及未来应用。

 

三、你自己的定位与学习。


基于以上一点的介绍,你大概可以明确你需要努力的方向。如果你不是致力于科研方向,那么你需要掌握如下的技能:


1.    需要理解主流机器学习算法的原理和应用。按照需要解决的问题,主要分为三大类,见下图:



2.    需要熟悉至少一门编程语言。如R,Python,SPSS Modeler,SAS,WEKA等。


关于软件,有三个原则:只要能达到目标的软件就是好软件;你研究的领域啥软件好用就用啥软件;不要妄想用一个软件解决所有问题。


3.    需要理解数据库基本原理,能够熟练操作至少一种数据库,如mysql,OracelDB2等。


4.     熟悉数据挖掘常见的运用场景。如客户生命周期管理、客户画像和客户分群、客户价值预测模型构建、推荐系统设计等。这些需要依托于不同行业。下图位CRM管理运用场景示例:


R语言+数据挖掘合璧,剑指商业应用


5.经典图书推荐

《数据挖掘:概念与技术》、《数据挖掘导论》、《机器学习实战》、《数据库系统概论》、《R语言实战》


当然,如果你能够接触到真实的数据挖掘项目和实战,你的提升将会非常快。CDA数据分析研究院开设的R语言数据挖掘课程,将世界客户关系管理方面的领导者美库尔公司(Merkle Inc)在专业管理咨询方面的几十年的经验积累与CDA数据分析研究院的教学理念与方法相结合,归纳了在商业智能系统设计、客户画像、精准营销、生命周期价值管理等主题的课程,结合R语言进行项目实操。感兴趣的小伙伴们快来学习吧!

 


一、课程信息



北京&远程:7月22-23,29-30,8月05-06日(6天)

授课安排:现场班5900元,远程班4400元

(1) 授课方式:面授直播两种形式,中文多媒体互动式授课方式

(2) 授课时间:上午9:00-12:00,下午13:30-16:30,16:30-17:00(答疑)

(3) 学习期限:现场与视频结合,长期学习加练习答疑。

 


二、报名流程



1. 在线填写报名信息

官网端:

R语言+数据挖掘合璧,剑指商业应用

微信端:

R语言+数据挖掘合璧,剑指商业应用


2. 给予反馈,确认报名信息

3. 网上缴费

4. 开课前一周发送电子版课件和教室路线图

 


三、课程大纲



第一阶段:数据挖掘前沿与R语言

1.商业数据分析的本质

2.商业数据分析的阶段与行业运用

3.商业数据挖掘通用方法论

4.R语言基础

5.数据清洗方法

6.错误值、缺失值及噪声值处理

7.变量压缩

a.案例:贷款数据的数据清洗

 

第二阶段:回归建模分析方法

1.线性回归建模与检验

2.回归模型的模型评估

3.正则化方法

4.逻辑回归介绍

5.分类模型的模型评估

6.极大似然法估计

7.模型评估方法

a.案例:信用卡客户价值预测模型

b.案例:汽车贷款初始评分模型

 

第三阶段:决策树与神经网络建模

1.使用决策树进行流失预警模型

2.决策树建模方法

3.决策树模型修剪

4.使用神经网络进行营销响应预测

5.感知器与BP神经网络

6.径向基神经网络

7.深度学习及常用框架(Caffe、Tensorflow)

a.案例:电子产品客户购买决策模型

b.案例:信贷产品行为评分模型

 

第四阶段:分类器与组合模型

1.KNN最近领域建模

2.贝叶斯网络

3.高级分类器:支持向量机( SVM)

4.封装与提升

5.随机森林与梯度树

a.案例:婚恋网站客户成功约会预测

b.案例:网站虚假注册客户识别

c.案例:客户精准营销案例

 

第五阶段:客户与市场分析方法

1.理解客户画像和客户分群

2.客户特征提取与FRM方法

3.层次聚类(Ward、Birch)

4.基于划分的聚类(K-means)

5.谱聚类方法

6.基于密度的聚类(DBSCAN)

a.案例:某人寿保险公司客户分群

b.案例:邮轮公司客户分群

 

第六阶段:推荐算法提升客户价值

1.Apriori算法、FP-growth算法

2.顺贯模型

3.推荐系统设计

4.模型生命周期

5.数据挖掘体系建设

a.案例:电商交叉销售案例

b.案例:金融机构交叉销售案例

 


四、课程讲师


常国珍

CDA数据分析师讲师/北京大学商学博士。曾就职于亚信科技商业运营咨询部、方正国际金融事业部、德勤管理咨询信息技术系统咨询部,多家金融信息部门和金融高科技公司数据分析顾问。主要从事征信数据集与信用风险建模、客户价值提升等项目。擅长将基于个体行为分析的微观经济学研究范式与量化模型向结合的客户终身价值建模。


瞿辉

美库尔公司分析经理/中国科学技术大学统计学硕士毕业。多年数据分析和挖掘的工作经历,精通SAS和R,对各种机器学习算法和统计模型都有深入研究,负责过保险、医药、零售以及电商等多个行业的数据分析项目,在客户画像、用户分群、精确营销、销售预测、营销组合优化等领域有丰富经验。

 


五、课程优惠



1.全日制学生及CDA LEVEL Ⅰ老学员8折优惠;

2.三人及以上报名9折优惠,五人及以上8折优惠;

3.CDALEVEL Ⅰ等级资格证书持有者立省1000元;

4.同时报名参加LEVELⅠ和LEVEL Ⅱ享受8折优惠。

 


六、联系我们



手机:18511302788(王老师)

   QQ:2315561922
   18500368335(孙老师)

   QQ:595302342
邮箱:wangzhenda@pinggu.org
   sunjing@cda.cn

—— Join Learn!


 

以上是关于R语言+数据挖掘合璧,剑指商业应用的主要内容,如果未能解决你的问题,请参考以下文章

我分析了《用商业案例学R语言数据挖掘》书评,告诉你R有多火

Rust + Go 双剑合璧:WebAssembly 领域应用

R语言数据分析/商业报告/人力资源绩效评估模型/关联规则数据挖掘/随机森林模型算法预测陈金文老师手把手教学

Flume+Kafka双剑合璧玩转大数据平台日志采集

应用大数据挖掘方法(R语言)发表SCI论文经验交流班 (6月4-7日线上班)

R语言data.table进行滚动数据连接,滚动连接通常用于分析涉及时间的数据(例如商业销售活动和对应的广告投放的安排之之间的关系)实战:实战和动画说明滚动数据连接的形式及方法