具有多个标签的 sklearn 确定性回归

Posted

技术标签:

【中文标题】具有多个标签的 sklearn 确定性回归【英文标题】:sklearn deterministic regression with multiple tags 【发布时间】:2020-06-29 17:07:34 【问题描述】:

我在 python 中有一个回归问题。我的输入数据集如下所示:

x= 均值、偏差、方差、varianceOfVariance

y = 走、慢、跑、保持

X 特征由值组成,Y 被二进制标记为 4 个类别之一。所以它可以是或步行或慢速或跑步或保持。 data.head() 看起来像这样。

我可以使用 train_test_split() 方法在 X_train、X_test、y_train、y_test 中拆分 pd 数据帧。

我想创建一个回归器(前 SVM,或线性回归器),以如下格式对这些标签进行预测:70% 步行,25% 慢速,0% 运行,5% 保持。

它必须是概率的,我尝试使用分类器,并将标签组合成一个变量,但现在我正在尝试概率机会。

使用 sklearn 库可以做到这一点,如果可以,怎么做?我想不通。

【问题讨论】:

【参考方案1】:

分类器已经是概率性的 - 您可以获得概率,而不仅仅是最高概率的类别。使用 predict_proba :

clf.fit(X_train, y_train)
score = clf.score(X_test, y_test)
probs = clf.predict_proba(X_test)

【讨论】:

谢谢!像魅力一样工作:)

以上是关于具有多个标签的 sklearn 确定性回归的主要内容,如果未能解决你的问题,请参考以下文章

在逻辑回归中预测具有最高可能概率的某个标签

具有不平衡类的sklearn逻辑回归

使用 sklearn - python 具有分类特征的多元线性回归

如何嵌套 Sklearn 的多个回归函数?

具有交叉验证的 Sklearn 线性回归返回 NA 准确度分数

在 sklearn 或任何 python 库中确定对非线性 SVM 回归贡献最大的特征