机器学习中的基础知识(入门上篇)

Posted cda-jg

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了机器学习中的基础知识(入门上篇)相关的知识,希望对你有一定的参考价值。

技术图片

前面我们已经给大家讲述了很多有关机器学习的概念,这些概念都是十分重要的,我们如果要学习人工智能的话就需要重视这些知识。在这篇文章我们接着给大家介绍机器学习中的基础知识,希望这篇文章能够给大家带来帮助。

(1)正则化就是对模型复杂度的惩罚。正则化帮助防止过拟合。正则化包括不同种类:L1 正则化、L2 正则化、dropout正则化。

(2)正则化率就是一种标量级,用lambda来表示,指正则函数的相对重要性。

(3)表征就是将数据映射到有用特征的过程。

(4)根目录就是指定放置 TensorFlow 检查点文件子目录和多个模型的事件文件的目录。?

(5)均方根误差就是均方误差的平方根。

(6)Saver就是负责存储模型检查点文件的 TensorFlow 对象。

(7)缩放就是特征工程中常用的操作,用于控制特征值区间,使之与数据集中其他特征的区间匹配。

(8)序列模型就是输入具有序列依赖性的模型。

(9)会话就是保持 TensorFlow 程序的状态。

(10)Sigmoid 函数就是把logistic 或多项式回归输出映射到概率的函数,返回的值在 0 到 1 之间。

(11)稀疏特征的值主要为 0 或空的特征向量。

(12)平方损失就是线性回归中使用的损失函数。该函数计算模型对标注样本的预测值和标签真正值之间差的平方。在平方之后,该损失函数扩大了不良预测的影响。

(13)静态模型就是离线训练的模型。

(14)稳态就是数据集中的一种数据属性,数据分布在一或多个维度中保持不变。通常情况下,维度是时间,意味着具备平稳性的数据不会随着时间发生变化。

(15)权重就是线性模型中的特征系数,或者深度网络中的边缘。线性模型的训练目标是为每个特征确定一个完美的权重。如果权重为 0,则对应的特征对模型而言是无用的。

(16)无标签样本就是包含特征但没有标签的样本。无标签样本是推断的输入。在半监督学习和无监督学习的训练过程中,通常使用无标签样本。

(17)测试集是数据集的子集。模型经过验证集初步测试之后,使用测试集对模型进行测试。可与训练集和验证集对照阅读。

我们在这篇文章中给大家介绍了很多的内容,虽然都是机器学习中比较简单的知识,但万丈高楼平地起,我们一定要一步步把基础打牢固。希望这篇文章能够给大家带来帮助。

 

以上是关于机器学习中的基础知识(入门上篇)的主要内容,如果未能解决你的问题,请参考以下文章

《自然语言处理实战入门》 ---- 笔试面试题:机器学习基础(21-40)

《自然语言处理实战入门》 ---- 笔试面试题:机器学习基础(21-40)

《自然语言处理实战入门》 ---- 笔试面试题:机器学习基础(81-100)

《自然语言处理实战入门》 ---- 笔试面试题:机器学习基础(41-60)

《自然语言处理实战入门》 ---- 笔试面试题:机器学习基础(81-100)

《自然语言处理实战入门》 ---- 笔试面试题:机器学习基础(41-60)