EXCEL线性回归中 df , significanceF , F , coefficients , Standard Error , t Stat , P-value 啥意思

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了EXCEL线性回归中 df , significanceF , F , coefficients , Standard Error , t Stat , P-value 啥意思相关的知识,希望对你有一定的参考价值。

请详细解答下 还有Lower 95%和upper 95%都代表什么 运用这些怎么确定它的方程和斜率,系数 谢谢了 [ 不排除会追加悬赏 ] 要详细解答

df=degree of freedom 自由度
F联合检验F值
coefficient回归系数
standard error标准差
T-stat T检验值=回归系数/标准差
P-value P值,T检验值查表对应的P概率值
Lower 95%和upper 95%置信度为95%的下限和上限区间
你缺乏计量经济学知识,建议学习下就明白这些意思啦
参考技术A 大学课程中的统计与概率提供基本知识
六西格玛绿带培训涵盖上述名词定义和应用
用excel回归较麻烦,建议采用Minitab, 简单好用.
词汇解释可以取Minitab的帮助里面找
参考技术B
暗baby,希望对你有用

多索引 df 中的线性回归

【中文标题】多索引 df 中的线性回归【英文标题】:Linear Regression in a multiindex df 【发布时间】:2021-08-16 20:22:14 【问题描述】:

给定下面的多索引多列数据框,我想将 LinearRegression 应用于此数据框的每个块,例如,对于每个 Station_Number,我想在 LST 和 Value 之间运行回归。 df 看起来像这样:

                           Latitude  Longitude        LST  Elevation      Value
Station_Number Date                                                            
RSM00025356    2019-01-01   66.3797     173.33 -31.655008       78.0 -28.733333
               2019-02-02   66.3797     173.33 -17.215009       78.0 -17.900000
               2019-02-10   66.3797     173.33 -31.180006       78.0 -19.500000
               2019-02-26   66.3797     173.33 -19.275007       78.0  -6.266667
               2019-04-23   66.3797     173.33 -12.905004       78.0  -4.916667

之后还有更多的站点。理想情况下,输出只是每个站号的回归结果

【问题讨论】:

【参考方案1】:

您可以使用 groupby 拆分 DataFrame,然后运行组内的每个回归。您可以将结果存储在字典中,其中键是“Station_Number”。我将使用 statsmodels 进行回归,但有许多可能的库,这取决于您对标准错误和推理的关心程度。

import statsmodels.formula.api as smf

d = 
for station,gp in df.groupby('Station_Number'):
    mod = smf.ols(formula='LST ~ Value', data=gp)
    d[station] = mod.fit()

回归结果:

d['RSM00025356'].params
#Intercept   -11.676331
#Value         0.696465
#dtype: float64

d['RSM00025356'].summary()

                            OLS Regression Results                            
==============================================================================
Dep. Variable:                    LST   R-squared:                       0.660
Model:                            OLS   Adj. R-squared:                  0.547
Method:                 Least Squares   F-statistic:                     5.831
Date:                Fri, 28 May 2021   Prob (F-statistic):             0.0946
Time:                        11:17:51   Log-Likelihood:                -14.543
No. Observations:                   5   AIC:                             33.09
Df Residuals:                       3   BIC:                             32.30
Df Model:                           1                                         
Covariance Type:            nonrobust                                         
==============================================================================
                 coef    std err          t      P>|t|      [0.025      0.975]
------------------------------------------------------------------------------
Intercept    -11.6763      5.143     -2.270      0.108     -28.043       4.690
Value          0.6965      0.288      2.415      0.095      -0.221       1.614
==============================================================================
Omnibus:                          nan   Durbin-Watson:                   2.536
Prob(Omnibus):                    nan   Jarque-Bera (JB):                0.299
Skew:                           0.233   Prob(JB):                        0.861
Kurtosis:                       1.895   Cond. No.                         35.9
==============================================================================

【讨论】:

以上是关于EXCEL线性回归中 df , significanceF , F , coefficients , Standard Error , t Stat , P-value 啥意思的主要内容,如果未能解决你的问题,请参考以下文章

Windows7怎样用Excel作多元线性回归

多索引 df 中的线性回归

Python:多元线性回归:statsmodels.formula.api.ols()

怎样用excel进行权重为1/c的线性回归

如何处理多元线性回归中的误差维度?

在Python中获取线性回归中每一行的系数