带权重的 Scikit-Learn 分类和回归

Posted

技术标签:

【中文标题】带权重的 Scikit-Learn 分类和回归【英文标题】:Scikit-Learn Classification and Regression with Weights 【发布时间】:2013-06-20 08:55:19 【问题描述】:

如果我想对每个样本进行不同的加权,我该如何在 sklearn 中进行分类或回归?有没有办法使用自定义损失函数来做到这一点?如果是这样,该损失函数一般看起来像什么?有没有更简单的方法?

【问题讨论】:

【参考方案1】:

要称量单个样本,请将sample_weight 数组输入估计器的fit 方法。这应该是一个长度为 n_samples 的一维数组(即在大多数任务中与 y 的维度相同):

estimator.fit(X, y, sample_weight=some_array)

并非所有型号都支持此功能,请查看文档。

【讨论】:

以上是关于带权重的 Scikit-Learn 分类和回归的主要内容,如果未能解决你的问题,请参考以下文章

Scikit-learn:权重在岭回归中的作用

在 scikit-learn 的逻辑回归中设置类权重的数学原理是啥?

R 和 scikit-learn 在分类任务中与逻辑回归的比较

为啥 sklearn 逻辑回归正则化权重和截距?

Scikit-Learn 逻辑回归严重过拟合数字分类训练数据

scikit-learn,线性回归中的分类(但数字)特征