sample_weight 在 SGDClassifier 中是如何工作的?
Posted
技术标签:
【中文标题】sample_weight 在 SGDClassifier 中是如何工作的?【英文标题】:How does sample_weight work in SGDClassifier? 【发布时间】:2019-09-18 08:28:40 【问题描述】:我想在训练SGDClassifier
时使用重要性抽样。我看到fit
和partial_fit
方法中有一个sample_weight
参数,但我不确定这个参数是如何工作的。
假设我有 10 个样本,我使用一个具有 10 个权重的数组,这些权重会乘以相对样本的损失函数吗?
【问题讨论】:
【参考方案1】:你可以在linear_model.sgd_fast找到相关代码,最相关的一行是:
update *= class_weight * sample_weight
在每个更新步骤之后,最终更新只是根据所提供的任何样本或类权重进行修改。
可以在SGD: Weighted samples的用户指南中找到高级结果的示例
【讨论】:
以上是关于sample_weight 在 SGDClassifier 中是如何工作的?的主要内容,如果未能解决你的问题,请参考以下文章
在 Keras 中使用 sample_weight 进行序列标记
将 sample_weights 用于平衡数据集是不是有意义?
scikit 随机森林 sample_weights 的使用
如何纠正 sklearn.naive_bayes 中的 sample_weight?
警告:tensorflow:sample_weight 模式被强制从 ... 到 ['...']
Python SkLearn Gradient Boost Classifier Sample_Weight Clarification