机器学习实战机器学习基础

Posted jason-lc

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了机器学习实战机器学习基础相关的知识,希望对你有一定的参考价值。

1.1 机器学习概念:

机器学习能让我们从数据集中受到启发,换句话说,我们会利用计算机来彰显数据背后的真实含义。

机器学习就是把无序的数据转换成有用的信息。

1.2 机器学习的主要任务:

大多数人都见过回归的例子——数据拟合曲线:通过给定数据点的最优拟合曲线。分类和回归属于监督学习(因为这类算法必须知道预测什么,即目标变量的分类信息)。

无监督学习中,将数据集合分成由类似的对象组成的多个类的过程被称为聚类;将寻找描述数据统计值的过程称之为密度估计。

技术分享图片

1.3 使用机器学习算法的目的:

首先考虑使用机器学习算法的目的。如果是预测目标变量的值,可以选择监督学习算法,否则选择无监督学习算法。确定选择监督学习后,再判断目标变量的类型,离散型(如是/否,1/2/3,A/B/C或者红/黄/黑等),则可以选择分类算法;如果目标是连续型变量,如0.0~100.00、-999~999或者+∞~-∞等,则需要选择回归算法。

如果不想预测目标变量的值,则可以选择无监督学习算法,进一步分析是否需要将数据划分为离散的组,如果这是唯一的需求,则使用聚类算法;如果还需要估计数据与每个分组的相似程度,则需要使用密度估计算法。

1.4 开发机器学习应用程序的步骤:

(1)收集数据

(2)准备输入数据(得到数据后,必须确保数据格式符合要求)

(3)分析输入数据(人工分析以前得到的数据——是否为空值,异常值,)

(4)训练算法

(5)测试算法

(6)使用算法

NumPy 函数库基础

技术分享图片

以上是关于机器学习实战机器学习基础的主要内容,如果未能解决你的问题,请参考以下文章

机器学习实战第1章 机器学习基础

机器学习实战之第一章 机器学习基础

机器学习实战机器学习基础

机器学习实战笔记-1基础

《自然语言处理实战入门》 ---- 笔试面试题:机器学习基础(81-100)

《自然语言处理实战入门》 ---- 笔试面试题:机器学习基础(41-60)