什么是Logistic模型

Posted 2023-05-12

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了什么是Logistic模型相关的知识，希望对你有一定的参考价值。

　　logistic回归又称logistic回归分析，主要在流行病学中应用较多，比较常用的情形是探索某疾病的危险因素，根据危险因素预测某疾病发生的概率，等等。例如，想探讨胃癌发生的危险因素，可以选择两组人群，一组是胃癌组，一组是非胃癌组，两组人群肯定有不同的体征和生活方式等。这里的因变量就是是否胃癌，即“是”或“否”，为两分类变量，自变量就可以包括很多了，例如年龄、性别、饮食习惯、幽门螺杆菌感染等。自变量既可以是连续的，也可以是分类的。通过logistic回归分析，就可以大致了解到底哪些因素是胃癌的危险因素。
　　logistic回归与多重线性回归实际上有很多相同之处，最大的区别就在于他们的因变量不同，其他的基本都差不多，正是因为如此，这两种回归可以归于同一个家族，即广义线性模型（generalized linear model）。这一家族中的模型形式基本上都差不多，不同的就是因变量不同，如果是连续的，就是多重线性回归，如果是二项分布，就是logistic回归，如果是poisson分布，就是poisson回归，如果是负二项分布，就是负二项回归，等等。只要注意区分它们的因变量就可以了。
　　logistic回归的因变量可以是二分类的，也可以是多分类的，但是二分类的更为常用，也更加容易解释。所以实际中最为常用的就是二分类的logistic回归。
　　logistic回归的主要用途：一是寻找危险因素，正如上面所说的寻找某一疾病的危险因素等。二是预测，如果已经建立了logistic回归模型，则可以根据模型，预测在不同的自变量情况下，发生某病或某种情况的概率有多大。三是判别，实际上跟预测有些类似，也是根据logistic模型，判断某人属于某病或属于某种情况的概率有多大，也就是看一下这个人有多大的可能性是属于某病。
　　这是logistic回归最常用的三个用途，实际中的logistic回归用途是极为广泛的，logistic回归几乎已经成了流行病学和医学中最常用的分析方法，因为它与多重线性回归相比有很多的优势，这些优势将在以后的文章中一一介绍。本篇文章主要是先让大家对logistic回归有一个初步的了解，以后会对该方法进行详细的阐述。参考技术A 客户是每个企业的命脉，商业客户的信用度主要反映在合同的履约情况与应收帐款的回款过程中。随着大多数企业进销存与财务系统的完善，问题则更多暴露在财务与业务数据无法实时关联导致客户信用度的判断滞后，进而直接影响营销过程。
我们所提供的客户信用度模型，在客户细分的基础上，结合我们的企业客户管理模型，导入财务模块或销售模块中的客户销售收入明细数据，导入应收管理中的应收余额与应收帐龄等数据，运用logistic回归、时间序列、移动平均等统计分析与数据挖掘技术进行分析，得出反映客户信用度水平的综合kpi，并给出建议的信用额度和信用期限，从而动态掌握企业客户的信用状况，降低现金流等经营风险。参考技术B 已经有相关的回答了
http://wenwen.sogou.com/z/q660099604.htm
如果觉得不够详细就去看书吧，这里很难解释清楚的。

probit回归与logistic回归有啥区别

probit与logistic的区别为：意思不同、用法不同、侧重点不同。

一、意思不同

1、probit：概率单位。

2、logistic：数理（符号）逻辑。

二、用法不同

1、probit：

probit模型服从正态分布。两个模型都是离散选择模型的常用模型。但logit模型简单直接，应用更广。而且，当因变量是名义变量时，Logit和Probit没有本质的区别，一般情况下可以换用。区别在于采用的分布函数不同，前者假设随机变量服从逻辑概率分布，而后者假设随机变量服从正态分布。

2、logistic：Logit模型是最早的离散选择模型，也是目前应用最广的模型。Logit模型是Luce（1959）根据IIA特性首次导出的；Marschark（1960）证明了Logit模型与最大效用理论的一致性；Marley（1965）研究了模型的形式和效用非确定项的分布之间的关系。

三、侧重点不同

1、probit：根据常态频率分配平均数的偏差计算统计单位。

2、logistic：离散选择法模型之一，Logit模型是最早的离散选择模型。

参考技术A 　　probit回归和logistic回归几乎可以用于相同的数据，对于二分类因变量，这两种方法的结果十分类似。那他们到底有什么区别呢？

　　如果从分布角度来讲，logit函数和probit的函数几乎重叠，但反映的含义不同，logit等于p/（1-p），这里p是结局发生的概率，而 probit的函数是F-1（p），注意-1是上标。F是累积的标准正态分布函数，所以F-1就是累积标准正态分布函数的逆函数或反函数。

　　从解释的角度来讲，logit更容易理解一些，因为p/（1-p）就是我们常说的odds，两个odds相比就是odds ratio，也就是我们最常用的OR值。所以当我们做出结果后，logistic回归所反应的实际意义就非常直观。而相比之下，probit的含义表示自变量对累积标准正态分布函数的逆作用，这个就太让人看不懂了。当然，实际上我们也可以通过正态分布值求出probit回归中的p，作为概率预测，只是比 logistic回归要稍微麻烦一些。

　　但这两个方法之间也是有关联的，通常情况下，probit回归估计出的参数值乘以1.814，大致会等于logistic回归中的参数值。

　　实际中具体选择哪个方法呢？据笔者所查阅的文献，尚未发现有理论依据，更多的仍是根据个人习惯。从文献的应用情况来看，logistic回归的应用远远多于 probit回归，这主要是因为logistic回归的易解释性，而不是logistic回归比probit回归更好或更适合数据。

　　但 probit回归并不是说就要被logistic回归替代了，从预测的角度来看，probit回归还是有较强的使用价值的。其预测概率效果与 logistic回归一样的好。如果你确实想知道到底你的数据用哪一个方法好，也不是没有办法，你可以看一下你的残差到底是符合logit函数呢还是符合 probit函数，当然，凭肉眼肯定是看不出来的，因为这两个函数本来就很接近，你可以通过函数的假定，用拟合优度检验一下。但通常，估计不会有人非要这么较真，因为没有必要。如果你的因变量是二分类，你无论用哪种方法，都不能说错。萝卜青菜，各有所爱而已。本回答被提问者和网友采纳参考技术B

Logistic回归比probit回归的应用广泛，同一数据两者的结果非常接近。

选择使用哪种方法没有统一的标准，主要看专业领域更常使用哪种方法。

Probit最常使用的是二分类probit，可在spssau中在线分析。

参考技术C 区别：
如果从分布角度来讲，logit函数和probit的函数几乎重叠，但反映的含义不同，logit等于p/（1-p），这里p是结局发生的概率，而 probit的函数是F-1（p），注意-1是上标。F是累积的标准正态分布函数，所以F-1就是累积标准正态分布函数的逆函数或反函数。
从解释的角度来讲，logit更容易理解一些，因为p/（1-p）就是我们常说的odds，两个odds相比就是odds ratio，也就是我们最常用的OR值。所以当我们做出结果后，logistic回归所反应的实际意义就非常直观。而相比之下，probit的含义表示自变量对累积标准正态分布函数的逆作用，这个就太让人看不懂了。当然，实际上我们也可以通过正态分布值求出probit回归中的p，作为概率预测，只是比 logistic回归要稍微麻烦一些。
关联：这两个方法之间是有关联的，通常情况下，probit回归估计出的参数值乘以1.814，大致会等于logistic回归中的参数值。
probit回归模型：最简单的probit模型就是指被解释变量Y是一个0,1变量，事件发生地概率是依赖于解释变量，即P(Y=1)=f(X)，也就是说,Y=1的概率是一个关于X的函数，其中f(.)服从标准正态分布。

logistic回归模型：(logistic regression)属于概率型非线性回归，它是研究二分类观察结果与一些影响因素之间关系的一种多变量分析方法。在流行病学研究中，经常需要分析疾病与各危险因素之间的定量关系，为了正确说明这种关系，需要排除一些混杂因素的影响。

以上是关于什么是Logistic模型的主要内容，如果未能解决你的问题，请参考以下文章