带假人的时间序列变量的多重回归

Posted

技术标签:

【中文标题】带假人的时间序列变量的多重回归【英文标题】:Multiple Regression on time series variables with dummies 【发布时间】:2018-04-03 09:25:32 【问题描述】:

我正在尝试通过在每月虚拟变量上回归这些变量来调整时间序列(8 年)自变量(197 个变量)的季节性。我将我的假人编码如下:

dummy1 <- model.matrix( ~ intraMonth, data = AnovaDataAll)

此后,我用虚拟变量对每个变量的因变量进行回归:

MultReg <- lapply(CorData[c(-1, -c(195:293))], function(x) summary(lm(formula = ReturnIndex ~ x + dummy1, data = CorData))) 

回归分析为我提供了以下结果(例如,第一个变量 = 权益):

$equity

Call:
lm(formula = ReturnIndex ~ x + dummy1, data = CorData)

Residuals:
    Min      1Q  Median      3Q     Max 
-49.273  -5.263   0.640   5.560  45.373 

Coefficients: (1 not defined because of singularities)
                   Estimate Std. Error t value Pr(>|t|)  
(Intercept)         -0.7610     1.9749  -0.385   0.7002  
x                   -0.3586     0.6165  -0.582   0.5611  
dummy1(Intercept)        NA         NA      NA       NA  
dummy1intraMonth2    4.8220     2.8404   1.698   0.0903 .
dummy1intraMonth3    2.5903     2.7683   0.936   0.3500  
dummy1intraMonth4    1.7586     2.8082   0.626   0.5315  
dummy1intraMonth5    1.6997     2.7823   0.611   0.5416  
dummy1intraMonth6    3.1196     2.8143   1.108   0.2683  
dummy1intraMonth7    2.5446     2.7546   0.924   0.3562  
dummy1intraMonth8   -1.7986     2.7646  -0.651   0.5157  
dummy1intraMonth9    2.5249     2.7768   0.909   0.3637  
dummy1intraMonth10   1.9284     2.7982   0.689   0.4911  
dummy1intraMonth11   3.9216     2.7773   1.412   0.1587  
dummy1intraMonth12   0.9890     2.9464   0.336   0.7373  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 11.55 on 406 degrees of freedom
Multiple R-squared:  0.02259,   Adjusted R-squared:  -0.006298 
F-statistic: 0.782 on 12 and 406 DF,  p-value: 0.6692

我想知道,我是否成功地对我的回归模型进行了季节性调整。此外,我想通过查看它们的 t 统计量来对所有变量的统计显着性进行排名。根据上面的输出,我是否只需要查看“x”行并取 -0.582 的 t 值?我如何解释第一个假人的截距(在这种情况下是一月假人)?如果我将截距设置在 12 月的假人而不是 1 月,这有关系吗?

【问题讨论】:

【参考方案1】:

根据上面的输出,我是否只需要查看“x”行并取 -0.582 的 t 值?

是的。

如何解释第一个假人(在本例中为一月假人)的截距?如果我将截距设置在 12 月的虚拟对象而不是 1 月,这有关系吗?

您只会得到 11 个虚拟变量(例如,两个分类 - 一个变量,依此类推)。您可以将月份中的任何一个作为截距。

【讨论】:

感谢您的回复。如果我假设 12 月虚拟变量会对季节性产生巨大影响,那么将 12 月虚拟变量设置为截距是否合适? 它不会改变拟合优度。如果你有一个男性 = 1 和女性 = 0 的性别变量,你可以改变男性 = 0 和女性 = 1。现在你会得到不同的参数,但它不会改变模型适合任何其他意义。

以上是关于带假人的时间序列变量的多重回归的主要内容,如果未能解决你的问题,请参考以下文章

多元线性回归多重共线性检验及避免方法,简单点的

SPSS数据分析—多重线性回归

向 MATLAB 多重回归添加交互项

单变量最小二乘回归中的多重 R 平方和调整 R 平方有啥区别?

更有效地进行多重回归模型(总共 8 个:2 个模型包含不同的预测变量和 4 个不同的结果)

蛮力是使用 Python 进行多重回归的最佳选择吗?