机器学习中的基础知识（入门上篇）

Posted 2021-02-09 cda-jg

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了机器学习中的基础知识（入门上篇）相关的知识，希望对你有一定的参考价值。

技术图片

前面我们已经给大家讲述了很多有关机器学习的概念，这些概念都是十分重要的，我们如果要学习人工智能的话就需要重视这些知识。在这篇文章我们接着给大家介绍机器学习中的基础知识，希望这篇文章能够给大家带来帮助。

（1）正则化就是对模型复杂度的惩罚。正则化帮助防止过拟合。正则化包括不同种类：L1 正则化、L2 正则化、dropout正则化。

（2）正则化率就是一种标量级，用lambda来表示，指正则函数的相对重要性。

（3）表征就是将数据映射到有用特征的过程。

（4）根目录就是指定放置 TensorFlow 检查点文件子目录和多个模型的事件文件的目录。?

（5）均方根误差就是均方误差的平方根。

（6）Saver就是负责存储模型检查点文件的 TensorFlow 对象。

（7）缩放就是特征工程中常用的操作，用于控制特征值区间，使之与数据集中其他特征的区间匹配。

（8）序列模型就是输入具有序列依赖性的模型。

（9）会话就是保持 TensorFlow 程序的状态。

（10）Sigmoid 函数就是把logistic 或多项式回归输出映射到概率的函数，返回的值在 0 到 1 之间。

（11）稀疏特征的值主要为 0 或空的特征向量。

（12）平方损失就是线性回归中使用的损失函数。该函数计算模型对标注样本的预测值和标签真正值之间差的平方。在平方之后，该损失函数扩大了不良预测的影响。

（13）静态模型就是离线训练的模型。

（14）稳态就是数据集中的一种数据属性，数据分布在一或多个维度中保持不变。通常情况下，维度是时间，意味着具备平稳性的数据不会随着时间发生变化。

（15）权重就是线性模型中的特征系数，或者深度网络中的边缘。线性模型的训练目标是为每个特征确定一个完美的权重。如果权重为 0，则对应的特征对模型而言是无用的。

（16）无标签样本就是包含特征但没有标签的样本。无标签样本是推断的输入。在半监督学习和无监督学习的训练过程中，通常使用无标签样本。

（17）测试集是数据集的子集。模型经过验证集初步测试之后，使用测试集对模型进行测试。可与训练集和验证集对照阅读。

我们在这篇文章中给大家介绍了很多的内容，虽然都是机器学习中比较简单的知识，但万丈高楼平地起，我们一定要一步步把基础打牢固。希望这篇文章能够给大家带来帮助。

以上是关于机器学习中的基础知识（入门上篇）的主要内容，如果未能解决你的问题，请参考以下文章