问题构建 (Framing)
-
什么是(监督式)机器学习?简单来说,它的定义如下:
- 机器学习系统通过学习如何组合输入信息来对从未见过的数据做出有用的预测。
标签
在简单线性回归中,标签是我们要预测的事物,即
y
变量。标签可以是小麦未来的价格、图片中显示的动物品种、音频剪辑的含义或任何事物。特征
在简单线性回归中,特征是输入变量,即
x
变量。简单的机器学习项目可能会使用单个特征,而比较复杂的机器学习项目可能会使用数百万个特征,按如下方式指定: {x1,x2,...xN}(可量化!)
样本
是指数据的特定实例: 有标签样本,无标签样本
模型
模型定义了特征与标签之间的关系。
-
训练表示创建或学习模型。也就是说,您向模型展示有标签样本,让模型逐渐学习特征与标签之间的关系。
-
推断表示将训练后的模型应用于无标签样本。也就是说,您使用训练后的模型来做出有用的预测 (
y‘
)。
回归模型可预测连续值。
分类模型可预测离散值。