sklearn多分类模型评测(LR, linearSVC, lightgbm)

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了sklearn多分类模型评测(LR, linearSVC, lightgbm)相关的知识,希望对你有一定的参考价值。

参考技术A

本数据集 上, 在迭代次数量级基本一致的情况下,lightgbm表现更优:树的固有多分类特性使得不需要OVR或者OVO式的开销,而且lightgbm本身就对决策树进行了优化,因此性能和分类能力都较好。

系统 64bit centOS
sklearn 0.19.1

sklearn.linear_model.SGDClassifier 如何用于多类分类?

【中文标题】sklearn.linear_model.SGDClassifier 如何用于多类分类?【英文标题】:how does sklearn.linear_model.SGDClassifier work for multi-class classifications? 【发布时间】:2019-06-08 22:05:41 【问题描述】:

我正在研究多类分类(10 个类)。我正在使用 sklearn.linear_model.SGDClassifier。我看到这个模型使用了一对多的方法。 SGDClassifier 有一个参数 class_weight:“与类关联的权重。如果没有给出,所有类都应该有一个权重。

“平衡”模式使用 y 的值来自动调整与输入数据中的类频率成反比的权重,如 n_samples / (n_classes * np.bincount(y))。" 在训练期间如何使用 class_weight?例如,我们有标签A - 5个样本,标签B - 15个样本,标签C - 100个样本。假设模型A vs B和C正在训练。class_weights是否包含在损失函数的计算中?“得分”怎么样“?SGDClassifier 有“准确度”作为默认评分选项。是否加权?

【问题讨论】:

损失函数是加权的,见***.com/questions/30972029/…。得分手不是。 【参考方案1】:

这是我的理解。 分类器优化以下目标函数:

L 是损失函数,w 是类权重。损失函数是用户定义的参数。

【讨论】:

以上是关于sklearn多分类模型评测(LR, linearSVC, lightgbm)的主要内容,如果未能解决你的问题,请参考以下文章

LR多分类与softmax分类

评估模型给出的准确度不等于 sklearn 分类报告准确度

Sklearn模型系数和预测linear_model中的不匹配

sklearn 中模型保存的两种方法

Scikit Learn sklearn.linear_model.LinearRegression:查看模型生成的结果

sklearn中的逻辑回归