神经网络入门（详细）

Posted 2022-05-20 -素心向暖

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了神经网络入门（详细）相关的知识，希望对你有一定的参考价值。

文章目录

机器学习流程

机器学习需要人工选取数据，提取数据。
深度学习是机器学习的一部分。

数据获取
特征工程
数据特征决定了模型的上限
预处理和特征提取是最核心的
算法与参数选择决定了如何逼近这个上限
建立模型
评估与应用

传统特征提取方法：

为什么需要深度学习

·解决核心是，如何去提取特征

图像分类

计算机视觉面临的挑战

照射角度
性状改变
部分遮蔽
背景混入

机器学习常规套路

收集数据并给定标签
训练一个分类器
测试，评估

K近邻

K近邻算法

数据：两类点方块和三角
绿色的点属于方块还是三角呢？
K=3还是K=5？结果一样吗？

K近邻计算流程：

就算已知类别数据集中的点与当前点的距离
按照距离依次排序
选取与当前点距离最小的K个点
确定前K个点所在类别的出现概率
返回前K个点出现频率最高的类别作为当前点预测分类

K近邻分析

KNN 算法本身简单有效，它是一种 lazy-learning 算法。
分类器不需要使用训练集进行训练，训练时间复杂度为0。
KNN 分类的计算复杂度和训练集中的文档数目成正比，也就是说，如果训练集中文档总数为 n，那么 KNN 的分类时间复杂度为O（n）。
K 值的选择，距离度量和分类决策规则是该算法的三个基本要素。

距离的选择：

L1 distance： $d_1(I_1,I_2)=\\sum_p \\vert I_1^p - I_2^p \\vert$

为什么K近邻不能用来图像分类？

背景主导是一个最大的问题，我们关注的却是主体（主要成分）
如何才能让机器学习到哪些是重要的成分呢？

神经网络基础

线性函数

从输入 --> 输出的映射

计算方法

什么样的 W 更适合我们的预期目标

损失函数

如何衡量分类的结果呢？

结果的得分值有着明显的差异，我们需要明确的指导模型的当前效果，有多好或是多差！

如果损失函数的值相同，那么意味着两个模型一样吗？

在训练过程中，关注权重参数是否会发生变异，发生过拟合

损失函数 $L_i=\\sum_j\\ne y_imax(0,s_j-s_y_i+1)$

损失函数其实有很多种，我们来实验一个

$S_j$ 错误类别， $S_y_i$ 正确类别
$\\Delta$ 表示容忍程度

正则化惩罚项

神经网络的缺点就是太强了

$\\lambda$ 越大，抑制效果越强

Softmax分类器

现在我们得到的是一个输入的得分值，但如果给我一个概率值岂不更好！

如何把一个得分值转换成一个概率值呢？

归一化： $P(Y=k|x=x_i)= e^sk \\over \\sum_je^sj$ $\\qquad$ where $\\;$ $s=f(x_i;W)$
计算损失值： $L_i=-logP(Y=y_i|X=x_i)$

交叉熵损失函数
通过对数函数求损失