sample_weight 在 SGDClassifier 中是如何工作的?

Posted

技术标签:

【中文标题】sample_weight 在 SGDClassifier 中是如何工作的?【英文标题】:How does sample_weight work in SGDClassifier? 【发布时间】:2019-09-18 08:28:40 【问题描述】:

我想在训练SGDClassifier 时使用重要性抽样。我看到fitpartial_fit 方法中有一个sample_weight 参数,但我不确定这个参数是如何工作的。

假设我有 10 个样本,我使用一个具有 10 个权重的数组,这些权重会乘以相对样本的损失函数吗?

【问题讨论】:

【参考方案1】:

你可以在linear_model.sgd_fast找到相关代码,最相关的一行是:

update *= class_weight * sample_weight

在每个更新步骤之后,最终更新只是根据所提供的任何样本或类权重进行修改。

可以在SGD: Weighted samples的用户指南中找到高级结果的示例

【讨论】:

以上是关于sample_weight 在 SGDClassifier 中是如何工作的?的主要内容,如果未能解决你的问题,请参考以下文章

在 Keras 中使用 sample_weight 进行序列标记

将 sample_weights 用于平衡数据集是不是有意义?

scikit 随机森林 sample_weights 的使用

如何纠正 sklearn.naive_bayes 中的 sample_weight?

警告:tensorflow:sample_weight 模式被强制从 ... 到 ['...']

Python SkLearn Gradient Boost Classifier Sample_Weight Clarification