F_Regression 来自 sklearn.feature_selection
Posted
技术标签:
【中文标题】F_Regression 来自 sklearn.feature_selection【英文标题】:F_Regression from sklearn.feature_selection 【发布时间】:2016-10-11 08:37:16 【问题描述】:我在 sklearn 特征选择模块中找到了用于特征选择的 F_regression 技术。我无法理解它使用的原理。 给出的描述是 - 单变量线性回归测试。 用于测试单个回归器效果的快速线性模型,按顺序对多个回归器进行测试。 这分 3 步完成:
-
1.感兴趣的回归量和数据是正交化的常数回归量。
-
2. 计算数据和回归量之间的互相关。
- 3。它转换为 F 分数,然后转换为 p 值。
我无法理解这一点,请有人用外行的方式解释一下。
【问题讨论】:
【参考方案1】:文档中的语言有点迟钝。我相信“数据”是指响应。首先,选择的回归器和响应相对于其余的回归器是正交的。这减少了可能存在的任何多重共线性。然后,计算所选回归量与响应之间的相关性。在单变量设置中,相关系数是 R^2 的平方根,可以用用于测试模型整体显着性的 F 统计量来写(另见:https://stats.stackexchange.com/questions/56881/whats-the-relationship-between-r2-and-f-test)。所以接下来,将相关性转换为 F 统计量,计算对应的 p 值,并返回 F 和 p。如果有多个回归器,则一次对所有回归器执行此操作。
【讨论】:
以上是关于F_Regression 来自 sklearn.feature_selection的主要内容,如果未能解决你的问题,请参考以下文章