向 MATLAB 多重回归添加交互项
Posted
技术标签:
【中文标题】向 MATLAB 多重回归添加交互项【英文标题】:Adding Interaction Terms to MATLAB Multiple Regression 【发布时间】:2015-07-19 16:07:12 【问题描述】:我目前正在使用 MATLAB 的 LinearModel.fit
函数运行多元线性回归,对于如何手动将交互项正确添加到模型中,我感到有些困惑。据我所知,LinearModel.fit
本身并不标准化变量,所以我一直在手动进行。
到目前为止,我的做法是
-
标准化每个变量的观察结果
将特定变量的相应标准化值相乘以创建交互项,然后将这些新变量添加到回归数据集中
运行回归
这是正确的方法吗?在计算“原始”项之后,我是否也应该标准化交互项变量?任何帮助将不胜感激!
【问题讨论】:
【参考方案1】:是否标准化交互项可能取决于您打算对模型做什么。标准化通常不会影响模型性能,因为它允许更直接的模型解释,因为您学习的系数将在相似的范围内。我怀疑是否这样做在很大程度上是一个见仁见智的问题。 Here is a relevant stats.stackexchange post 这可能会有所帮助。
我的直觉与您迄今为止描述的过程相同。
【讨论】:
感谢您的回复。那么你认为我应该标准化交互术语吗? 我不会标准化交互术语,不。在我看来,这只会使以后的分析更加混乱(即两个标准化变量的标准化乘积)。以上是关于向 MATLAB 多重回归添加交互项的主要内容,如果未能解决你的问题,请参考以下文章
如何使用 scikit-learn 仅删除多项式回归中的交互项?