数据挖掘第一天

Posted 2020-06-17

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了数据挖掘第一天相关的知识，希望对你有一定的参考价值。

---恢复内容开始---

在看了大话数据挖掘这本书前36页后，学到的知识。

数据挖掘（Data Mining）和数据库中的知识发现（KDD）互为别名。

数据挖掘的实例：啤酒与尿布、流量套餐用户群、套餐用户流失量原因、捆绑销售、零件维修费用的节制。

数据挖掘的概念：基于大量的、不完全的、有噪音的、模糊的、随机的数据中发现隐藏的有价值的知识。不完全的意思是在收集相应数据有缺失的，有噪音是获得的数据偏离了真实值，比如外界的干扰、测量仪器的故障、人工输入或抄写时的误差等。模糊性是指事物本身从属概念的不确定性，参照性，比如身高的高矮。随机性是指事件发生与否的不确定性，比如购买啤酒的即兴想法。

数据挖掘的功能：关联分析、聚类分析、分类分析、预测、回归分析、判别分析、时间序列分析、偏差甄别等。

数据挖掘的三大支柱：数据库、统计学、机器学习。

数据仓库：是一个面向主题的、集成的、随时间变化的、持久的数据集合，用于支持管理层的决策过程。

联机在线分析（OnLine Analytical Processing,OLAP）:一种具有对数据进行汇集、合并和聚集以及从不同的角度观察信息的分析技术。

---恢复内容结束---

以上是关于数据挖掘第一天的主要内容，如果未能解决你的问题，请参考以下文章

python自动化开发-[第一天]-基础数据类型与编码

JDBC第一天

python第一天

python 第一周（第一天）我的python成长记一个月搞定python数据挖掘！

Code changed world

第一天C#学习