CRISP-DM (cross-industry standard process for data mining)跨行业数据挖掘过程标准

Posted Data+Science+Insight

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了CRISP-DM (cross-industry standard process for data mining)跨行业数据挖掘过程标准相关的知识,希望对你有一定的参考价值。

CRIP-DM+SEMMA

CRISP-DM (cross-industry standard process for data mining),即为“跨行业数据挖掘过程标准"。

 

长期以来,随着数据挖掘市场的发展和成熟,由不同的组织机构提出过很多的方法论,如CRISP-DM、SEMMA、5A等,其中CRISP-DM、SEMMA是应用最为广泛。CRISP-DM (cross-industry standard process for data mining),即为“跨行业数据挖掘过程标准"。此KDD过程模型于1999年欧盟机构联合起草. 通过近几年的发展,CRISP-DM 模型在各种KDD过程模型中占据领先位置,采用量达到近60%。排在其后的是由SAS公司提出的SEMMA。SEMMA更偏重于数据挖掘的建模过程,与SAS的EM工具进行整合,其模型管理部署部分则体现在另外的工具套件中。CRISP-DM是从一个数据挖掘项目执行的角度谈方法论,CRISP- DM的考虑的范围比SEMMA 要大。CRISP-DM强调,数据挖掘不单是数据的组织或者呈现,也不仅是数据分析和统计建模,而是一个从理解业务需求、寻求解决方案到接受实践检验的完整过程。因此,从一个项目的管理实施完整流程来说,CRISP-DM更适用一些,本文后续主要以CRISP-DM为主进行详细介绍。

 

 

在过去几年,随着信息化技术的高速发展,数据逐渐变为企业最有价值的战略资产,人们迫切希望能够从数据中发掘价值和探索规律,以便为企业在研发、生产、营销、管理、运维等各个环节遇到的问题提供新的解决思路,用数字化战略为企业赋能。

 

为什么需要一个数据挖掘方法论?

要实现对数据价值的深度发掘,

以上是关于CRISP-DM (cross-industry standard process for data mining)跨行业数据挖掘过程标准的主要内容,如果未能解决你的问题,请参考以下文章

(CRISP-DM)数据科学探索流程

干货:数据挖掘方法论与工程化思考

数据挖掘

经验数据挖掘的九个经验

9条经验,教你做好数据挖掘模型!

数据挖掘教你如何写一部畅销网络小说