F_Regression 来自 sklearn.feature_selection

Posted

技术标签:

【中文标题】F_Regression 来自 sklearn.feature_selection【英文标题】:F_Regression from sklearn.feature_selection 【发布时间】:2016-10-11 08:37:16 【问题描述】:

我在 sklearn 特征选择模块中找到了用于特征选择的 F_regression 技术。我无法理解它使用的原理。 给出的描述是 - 单变量线性回归测试。 用于测试单个回归器效果的快速线性模型,按顺序对多个回归器进行测试。 这分 3 步完成:

    1.感兴趣的回归量和数据是正交化的常数回归量。
    2. 计算数据和回归量之间的互相关。
    3。它转换为 F 分数,然后转换为 p 值。

我无法理解这一点,请有人用外行的方式解释一下。

【问题讨论】:

【参考方案1】:

文档中的语言有点迟钝。我相信“数据”是指响应。首先,选择的回归器和响应相对于其余的回归器是正交的。这减少了可能存在的任何多重共线性。然后,计算所选回归量与响应之间的相关性。在单变量设置中,相关系数是 R^2 的平方根,可以用用于测试模型整体显着性的 F 统计量来写(另见:https://stats.stackexchange.com/questions/56881/whats-the-relationship-between-r2-and-f-test)。所以接下来,将相关性转换为 F 统计量,计算对应的 p 值,并返回 F 和 p。如果有多个回归器,则一次对所有回归器执行此操作。

【讨论】:

以上是关于F_Regression 来自 sklearn.feature_selection的主要内容,如果未能解决你的问题,请参考以下文章

机器学习,数据挖掘等领域的知识碎片不定期更新

卡方作为回归的评分函数

检查网络响应是来自服务器还是来自 Chrome 缓存

书评:男人来自火星,女人来自金星-约翰.格雷

为啥 WCF 服务能够处理来自不同进程的调用而不是来自线程的调用

来自 viewDidAppear 的 Segue 调用有效,但不是来自 viewWillAppear