机器学习---算法---逻辑回归

Posted 2021-01-29 qing1991

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了机器学习---算法---逻辑回归相关的知识，希望对你有一定的参考价值。

转自：https://blog.csdn.net/ustbbsy/article/details/80423294

1 引言
最近做一个项目，准备用逻辑回归来把数据压缩到[-1,1]，但最后的预测却是和标签类似（或者一样）的预测。也就是说它的predict的结果不是连续的，而是类别，1,2,3,...k。对于predict_proba，这是预测的概率，但概率有很多个，数目为训练集类别（label）的个数。逻辑回归的原理，就是取出最大概率对应的类别。

所以逻辑回归，不是回归，而是分类器，二分类，多分类。

逻辑回归，是一个很有误导性的概念。

这是个人最近的体会，入门的读者请忽略。

2 线性回归
先说一下，一般模型的训练和预测过程：

1，训练：通过训练数据来训练模型，也就是通常我们所说的学习过程，即确定模型的参数。

2，预测：训练过后，模型参数确定，有预测数据输入，就会得到一个结果。

常见的线性回归y=wx+b,我们通过训练集来训练出我们的模型，也就是得到我们的模型参数w,b，这样，我们的直线或者超平面(x是多维的)就确定了。接着，对于测试集，来了一个数据x，w,b已经学习出来了，带入y=wx+b，就会得到一个y值，也就是我们的预测值。注意，它是浮点数。

这里得到的y为什么叫回归呢，因为y不是类别（label）中的一个，它是预测出来的实数（大部分是小数）。

有的同学可能不理解什么是回归？我解释一下：

首先，需要明白二分类，类别/标签/label是二值，{0，1}或{-1，1}，总之它的类别数两个。相信你已经知道多分类了，就是类别是多值的，{0，1，2，3，4}等，这是5类。那么回归是什么你呢。回归的取值，就不是像分类这样取整数了，它是小数，浮点数，是连续的，例如（0，1）之间的取值等。

3 逻辑回归
前面已经说了，虽然它不是回归，但是名字已经确定了，大家还是这么叫的。

前面的线性回归，我们已经得到y=wx+b。它是实数，y的取值范围可以是（负无穷，正无穷）。现在，我们不想让它的值这么大，所以我们就想把这个值给压缩一下，压缩到[0,1]。什么函数可以干这个事呢？研究人员发现signomid函数就有这个功能。所以，他们就尝试着，用signomid函数搞一搞这个y。