机器学习笔记——感知机
Posted Lyndon_zheng
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了机器学习笔记——感知机相关的知识,希望对你有一定的参考价值。
Perceptron(感知机)
感知机是二分类的线性分类器,属于判别模型。由Rosenblatt在1957年提出,是神经网络和支持向量机(SVM)的基础。感知机本身相当于神经网络中的一个神经元,只能进行简单的线性分类。感知机的学习目标是通过训练数据得到线性划分的超平面。为此,引入基于分类误差的损失函数,利用梯度下降法对损失函数进行极小化,来求解感知机模型。
1.感知机模型
定义:假设输入空间(特征空间)是
χ⊆Rn
,输出空间是
Y=+1,−1
.输入
x∈χ
是样本的特征向量,对应的输出
y∈Y
是样本的类别。输入空间到输出空间的映射模型为:
其中 x 是输入样本的特征向量, w,b 是感知机的模型参数, w 是权值, b 是偏置,都需要通过学习得到。
2.感知机学习策略
线性可分定义:给定一个数据集
其中 xi 是样本特征向量, yi 是样本对应类别,如果存在某个超平面 S:w⋅x+b=0 能够将数据集的正样本和负样本全部正确地划分到超平面的两侧,则样本 T 是线性可分数据集。
假设数据集是线性可分的,感知机的目标就是求得一个能够将所有样本正确分类的超平面,即学习出前面感知机模型的参数
1∥w∥|w⋅xi+b|
对于误分类数据 (xi,yi) 有:
−yi(w⋅xi+b)>0
即预测类别 (w⋅xi+b) 和实际类别 yi 总是相反,因此可以定义误分类点 (xi,yi) 到超平面的距离为:
−1∥w∥yi|w⋅xi+b|
如果有M个误分类点,那么所有误分类点到超平面的总距离为:
−1∥w∥∑(xi,yi)∈Myi|w⋅xi+b|
不考虑前面系数,则对于任意给定的训练数据集
T=(x1,y统计学习方法(第2章)感知机 学习笔记