机器学习导图系列:数据处理
Posted takeurhand
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了机器学习导图系列:数据处理相关的知识,希望对你有一定的参考价值。
机器学习导图系列教程旨在帮助引导开发者对机器学习知识网络有一个系统的概念,其中具体释义并未完善,需要开发者自己探索才能对具体知识有深入的掌握。本项目灵感来自Daniel Formoso的github开源项目。本文作者对其项目进行翻译、整理、批注等二次创作,其中不乏生僻的数学名词,对于没有留过学的作者来说费了很多功夫。我又将导图整理成了知识卡片,方便大家查看。由于机器学习的知识网络很大,导致完整的导图过大,文章中的图片可能经过压缩,如需完整图片可查看github项目machine-learning-mindmap-cn下载高清原图。本系列还在持续创作中,你的点赞、留言、star都会成为我持续创作的动力。
Daniel Formoso: https://github.com/dformoso/machine-learning-mindmap
machine-learning-mindmap-cn: https://github.com/caiyongji/machine-learning-mindmap-cn
机器学习导图系列分为五大模块。
- 机器学习数据处理
- 机器学习概念
- 机器学习过程
- 机器学习算法
- 机器学习模型及神经网络模型
数据类型
数据探索
数据清洗
特征插补
特征工程
特征选择
特征编码
特征归一化(Normalisation)或缩放(Scaling)
构造数据集
最后
你随手就是一个赞。
以上是关于机器学习导图系列:数据处理的主要内容,如果未能解决你的问题,请参考以下文章