probit回归与logistic回归有啥区别
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了probit回归与logistic回归有啥区别相关的知识,希望对你有一定的参考价值。
probit与logistic的区别为:意思不同、用法不同、侧重点不同。
一、意思不同
1、probit:概率单位。
2、logistic:数理(符号)逻辑。
二、用法不同
1、probit:
probit模型服从正态分布。两个模型都是离散选择模型的常用模型。但logit模型简单直接,应用更广。而且,当因变量是名义变量时,Logit和Probit没有本质的区别,一般情况下可以换用。区别在于采用的分布函数不同,前者假设随机变量服从逻辑概率分布,而后者假设随机变量服从正态分布。
2、logistic:Logit模型是最早的离散选择模型,也是目前应用最广的模型。Logit模型是Luce(1959)根据IIA特性首次导出的;Marschark(1960)证明了Logit模型与最大效用理论的一致性;Marley(1965)研究了模型的形式和效用非确定项的分布之间的关系。
三、侧重点不同
1、probit:根据常态频率分配平均数的偏差计算统计单位。
2、logistic:离散选择法模型之一,Logit模型是最早的离散选择模型。
参考技术A probit回归和logistic回归几乎可以用于相同的数据,对于二分类因变量,这两种方法的结果十分类似。那他们到底有什么区别呢?如 果从分布角度来讲,logit函数和probit的函数几乎重叠,但反映的含义不同,logit等于p/(1-p),这里p是结局发生的概率,而 probit的函数是F-1(p),注意-1是上标。F是累积的标准正态分布函数,所以F-1就是累积标准正态分布函数的逆函数或反函数。
从 解释的角度来讲,logit更容易理解一些,因为p/(1-p)就是我们常说的odds,两个odds相比就是odds ratio,也就是我们最常用的OR值。所以当我们做出结果后,logistic回归所反应的实际意义就非常直观。而相比之下,probit的含义表示自 变量对累积标准正态分布函数的逆作用,这个就太让人看不懂了。当然,实际上我们也可以通过正态分布值求出probit回归中的p,作为概率预测,只是比 logistic回归要稍微麻烦一些。
但这两个方法之间也是有关联的,通常情况下,probit回归估计出的参数值乘以1.814,大致会等于logistic回归中的参数值。
实 际中具体选择哪个方法呢?据笔者所查阅的文献,尚未发现有理论依据,更多的仍是根据个人习惯。从文献的应用情况来看,logistic回归的应用远远多于 probit回归,这主要是因为logistic回归的易解释性,而不是logistic回归比probit回归更好或更适合数据。
但 probit回归并不是说就要被logistic回归替代了,从预测的角度来看,probit回归还是有较强的使用价值的。其预测概率效果与 logistic回归一样的好。如果你确实想知道到底你的数据用哪一个方法好,也不是没有办法,你可以看一下你的残差到底是符合logit函数呢还是符合 probit函数,当然,凭肉眼肯定是看不出来的,因为这两个函数本来就很接近,你可以通过函数的假定,用拟合优度检验一下。但通常,估计不会有人非要这 么较真,因为没有必要。如果你的因变量是二分类,你无论用哪种方法,都不能说错。萝卜青菜,各有所爱而已。本回答被提问者和网友采纳 参考技术B
Logistic回归比probit回归的应用广泛,同一数据两者的结果非常接近。
选择使用哪种方法没有统一的标准,主要看专业领域更常使用哪种方法。
Probit最常使用的是二分类probit,可在spssau中在线分析。
参考技术C 区别:如果从分布角度来讲,logit函数和probit的函数几乎重叠,但反映的含义不同,logit等于p/(1-p),这里p是结局发生的概率,而 probit的函数是F-1(p),注意-1是上标。F是累积的标准正态分布函数,所以F-1就是累积标准正态分布函数的逆函数或反函数。
从解释的角度来讲,logit更容易理解一些,因为p/(1-p)就是我们常说的odds,两个odds相比就是odds ratio,也就是我们最常用的OR值。所以当我们做出结果后,logistic回归所反应的实际意义就非常直观。而相比之下,probit的含义表示自 变量对累积标准正态分布函数的逆作用,这个就太让人看不懂了。当然,实际上我们也可以通过正态分布值求出probit回归中的p,作为概率预测,只是比 logistic回归要稍微麻烦一些。
关联:这两个方法之间是有关联的,通常情况下,probit回归估计出的参数值乘以1.814,大致会等于logistic回归中的参数值。
probit回归模型:最简单的probit模型就是指被解释变量Y是一个0,1变量,事件发生地概率是依赖于解释变量,即P(Y=1)=f(X),也就是说,Y=1的概率是一个关于X的函数,其中f(.)服从标准正态分布。
logistic回归模型:(logistic regression)属于概率型非线性回归,它是研究二分类观察结果与一些影响因素之间关系的一种多变量分析方法。在流行病学研究中,经常需要分析疾病与各危险因素之间的定量关系,为了正确说明这种关系,需要排除一些混杂因素的影响。
以上是关于probit回归与logistic回归有啥区别的主要内容,如果未能解决你的问题,请参考以下文章