机器学习中的基础知识(入门上篇)
Posted cda-jg
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了机器学习中的基础知识(入门上篇)相关的知识,希望对你有一定的参考价值。
前面我们已经给大家讲述了很多有关机器学习的概念,这些概念都是十分重要的,我们如果要学习人工智能的话就需要重视这些知识。在这篇文章我们接着给大家介绍机器学习中的基础知识,希望这篇文章能够给大家带来帮助。
(1)正则化就是对模型复杂度的惩罚。正则化帮助防止过拟合。正则化包括不同种类:L1 正则化、L2 正则化、dropout正则化。
(2)正则化率就是一种标量级,用lambda来表示,指正则函数的相对重要性。
(3)表征就是将数据映射到有用特征的过程。
(4)根目录就是指定放置 TensorFlow 检查点文件子目录和多个模型的事件文件的目录。?
(5)均方根误差就是均方误差的平方根。
(6)Saver就是负责存储模型检查点文件的 TensorFlow 对象。
(7)缩放就是特征工程中常用的操作,用于控制特征值区间,使之与数据集中其他特征的区间匹配。
(8)序列模型就是输入具有序列依赖性的模型。
(9)会话就是保持 TensorFlow 程序的状态。
(10)Sigmoid 函数就是把logistic 或多项式回归输出映射到概率的函数,返回的值在 0 到 1 之间。
(11)稀疏特征的值主要为 0 或空的特征向量。
(12)平方损失就是线性回归中使用的损失函数。该函数计算模型对标注样本的预测值和标签真正值之间差的平方。在平方之后,该损失函数扩大了不良预测的影响。
(13)静态模型就是离线训练的模型。
(14)稳态就是数据集中的一种数据属性,数据分布在一或多个维度中保持不变。通常情况下,维度是时间,意味着具备平稳性的数据不会随着时间发生变化。
(15)权重就是线性模型中的特征系数,或者深度网络中的边缘。线性模型的训练目标是为每个特征确定一个完美的权重。如果权重为 0,则对应的特征对模型而言是无用的。
(16)无标签样本就是包含特征但没有标签的样本。无标签样本是推断的输入。在半监督学习和无监督学习的训练过程中,通常使用无标签样本。
(17)测试集是数据集的子集。模型经过验证集初步测试之后,使用测试集对模型进行测试。可与训练集和验证集对照阅读。
我们在这篇文章中给大家介绍了很多的内容,虽然都是机器学习中比较简单的知识,但万丈高楼平地起,我们一定要一步步把基础打牢固。希望这篇文章能够给大家带来帮助。
以上是关于机器学习中的基础知识(入门上篇)的主要内容,如果未能解决你的问题,请参考以下文章
《自然语言处理实战入门》 ---- 笔试面试题:机器学习基础(21-40)
《自然语言处理实战入门》 ---- 笔试面试题:机器学习基础(21-40)
《自然语言处理实战入门》 ---- 笔试面试题:机器学习基础(81-100)
《自然语言处理实战入门》 ---- 笔试面试题:机器学习基础(41-60)