如何针对某些特定值对面板数据回归系数进行联合Wald检验?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何针对某些特定值对面板数据回归系数进行联合Wald检验?相关的知识,希望对你有一定的参考价值。

我想对我的固定效应回归系数进行简单的联合Wald检验,但我想将限制设置为零以外的其他值。更具体地说我想测试:H0:ai = 0和b = 1每个i或基本上,是否提取截取来自固定效果模型(ai)(我知道在固定效果模型中没有拦截但你仍然可以通过fixef()命令提取它们,如果固定效应模型是正确的模型,它们应该接近零)对于每个i等于零,我的系数(bi)等于1。

这是我有的:

library(plm)


form <- R_excess ~ I(beta_MKT_RF*MKT_RF) + I(beta_HML*HML) + I(beta_SMB*SMB)
reg1 <- plm(form, data=nlspd, model="within")

summary(reg1, vcov =function(x) vcovSCC(x, type="HC3", maxlag=12))

这是输出,你可以看到我的系数都接近1:

Call:
plm(formula = form, data = nlspd, model = "within")

Balanced Panel: n = 10, T = 624, N = 6240

Residuals:
       Min.     1st Qu.      Median     3rd Qu.        Max. 
-7.8706e-02 -9.0319e-03  3.8278e-05  8.9624e-03  1.1349e-01 

Coefficients:
                         Estimate Std. Error t-value  Pr(>|t|)    
I(beta_MKT_RF * MKT_RF) 1.0023818  0.0072942 137.422 < 2.2e-16 ***
I(beta_HML * HML)       0.9985867  0.0527123  18.944 < 2.2e-16 ***
I(beta_SMB * SMB)       0.9731437  0.0355880  27.345 < 2.2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Total Sum of Squares:    18.067
Residual Sum of Squares: 1.5037
R-Squared:      0.91677
Adj. R-Squared: 0.91661
F-statistic: 7808.71 on 3 and 623 DF, p-value: < 2.22e-16

我也可以使用以下方法获得固定效果拦截ai:

summary(fixef(reg1), vcov =function(x) vcovSCC(x, type="HC3", maxlag=12))
      Estimate  Std. Error t-value  Pr(>|t|)    
1   0.00127680  0.00062245  2.0512  0.040285 *  
2   0.00136923  0.00062251  2.1995  0.027877 *  
3   0.00104805  0.00062246  1.6837  0.092283 .  
4   0.00132979  0.00062259  2.1359  0.032727 *  
5  -0.00061048  0.00062252 -0.9807  0.326795    
6   0.00085262  0.00062247  1.3697  0.170816    
7  -0.00104724  0.00062250 -1.6823  0.092557 .  
8  -0.00089731  0.00062275 -1.4409  0.149672    
9  -0.00174805  0.00062292 -2.8062  0.005028 ** 
10 -0.00271173  0.00062343 -4.3497 1.385e-05 ***

现在我想对这些系数进行联合wald检验,以测试每个i:H0:ai = 0和b = 1。

编辑:这与固定效应的F检验不同,因为我正在测试非零假设。

答案

@ Helix123在评论中提到的The question并没有完全按照您的需要进行操作(也不是测试所有系数都为零),但它是相关的。特别是,如果您只想测试固定效果等于零,那么您可以在那里找到答案。

然而,在你的情况下,除了关于固定效应的假设之外,我们还测试所有其他系数是否取一些非零值。这就是它产生问题的原因。

如果你想测试一下,比如I(beta_HML * HML)的系数是零,那么提供给pFtest的限制模型(参见链接问题中的接受答案)将是reg2,如

form <- R_excess ~ -1 + I(beta_MKT_RF * MKT_RF) + I(beta_SMB * SMB)
reg2 <- plm(form, data = nlspd, model = "pooling") # Note "pooling", which sets fixed effects to zero

如果你想测试这个变量的系数是1,那么你可以使用reg3

form <- R_excess - I(beta_HML * HML) ~ -1 + I(beta_MKT_RF * MKT_RF) + I(beta_SMB * SMB)
reg3 <- plm(form, data = nlspd, model = "pooling") # Note "pooling", which sets fixed effects to zero

由于您的假设是关于所有三个剩余系数,我们实际上没有任何东西可以在右边估计。碰巧plm不喜欢这样,并抛出empty model错误。

如果我们使用lm,那么在公式中会有另一种选择,例如offset(beta_MKT_RF * MKT_RF),它会将系数固定为1并且不会被估计。但是,plm不允许使用offset

也就是说,似乎更容易的选择是使用lm,就像链接问题中所建议的那样。特别是,

data("Produc", package = "plm")
mU <- lm(log(gsp) ~ -1 + log(emp) + factor(state), data = Produc)
mR <- lm(log(gsp) ~ -1 + offset(log(emp)), data = Produc)
library(lmtest)
lrtest(mR, mU)
# Likelihood ratio test
#
# Model 1: log(gsp) ~ -1 + offset(log(emp))
# Model 2: log(gsp) ~ -1 + log(emp) + factor(state)
#   #Df  LogLik Df  Chisq Pr(>Chisq)    
# 1   1 -2187.9                         
# 2  50  1467.3 49 7310.4  < 2.2e-16 ***
# ---
# Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

因此mU包含固定效应并且无限制地估计log(emp)的效果,而mR不包含固定效应并且将log(emp)的效果固定为1。

您没有提供数据,但它应该接近

mU <- lm(R_excess ~ -1 + I(beta_MKT_RF * MKT_RF) + I(beta_HML * HML) +
           I(beta_SMB * SMB) + factor(var), data = nlspd)
mR <- lm(R_excess ~ -1 + offset(beta_MKT_RF * MKT_RF) + offset(beta_HML * HML) +
           offset(beta_SMB * SMB), data = nlspd)
lrtest(mR, mU)

其中var是横截面尺寸变量。

以上是关于如何针对某些特定值对面板数据回归系数进行联合Wald检验?的主要内容,如果未能解决你的问题,请参考以下文章

Python中某些特征的正系数线性回归

机器学习之回归篇

怎么用spss 具体步骤,做出回归系数和OR 和P 值

SKLearn 线性回归,但在开始之前设置某些系数

spss进行线性回归分析时,相关系数都符合,但是显著性不符合,如何调整

多元线性回归,对 Python 上的每个系数都有特定约束