数据挖掘第一天

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据挖掘第一天相关的知识,希望对你有一定的参考价值。

---恢复内容开始---

在看了大话数据挖掘这本书前36页后,学到的知识。

数据挖掘(Data Mining)和数据库中的知识发现(KDD)互为别名。

数据挖掘的实例:啤酒与尿布、流量套餐用户群、套餐用户流失量原因、捆绑销售、零件维修费用的节制。

数据挖掘的概念:基于大量的、不完全的、有噪音的、模糊的、随机的数据中发现隐藏的有价值的知识。不完全的意思是在收集相应数据有缺失的,有噪音是获得的数据偏离了真实值,比如外界的干扰、测量仪器的故障、人工输入或抄写时的误差等。模糊性是指事物本身从属概念的不确定性,参照性,比如身高的高矮。随机性是指事件发生与否的不确定性,比如购买啤酒的即兴想法。

数据挖掘的功能:关联分析、聚类分析、分类分析、预测、回归分析、判别分析、时间序列分析、偏差甄别等。

数据挖掘的三大支柱:数据库、统计学、机器学习。

数据仓库:是一个面向主题的、集成的、随时间变化的、持久的数据集合,用于支持管理层的决策过程。

联机在线分析(OnLine Analytical Processing,OLAP):一种具有对数据进行汇集、合并和聚集以及从不同的角度观察信息的分析技术。

 

 

---恢复内容结束---

以上是关于数据挖掘第一天的主要内容,如果未能解决你的问题,请参考以下文章

python自动化开发-[第一天]-基础数据类型与编码

JDBC第一天

python第一天

python 第一周(第一天) 我的python成长记 一个月搞定python数据挖掘!

Code changed world

第一天C#学习