具有多个标签的 sklearn 确定性回归

Posted

技术标签:

【中文标题】具有多个标签的 sklearn 确定性回归【英文标题】:sklearn deterministic regression with multiple tags 【发布时间】:2020-06-29 17:07:34 【问题描述】:

我在 python 中有一个回归问题。我的输入数据集如下所示:

x= 均值、偏差、方差、varianceOfVariance

y = 走、慢、跑、保持

X 特征由值组成,Y 被二进制标记为 4 个类别之一。所以它可以是或步行或慢速或跑步或保持。 data.head() 看起来像这样。

我可以使用 train_test_split() 方法在 X_train、X_test、y_train、y_test 中拆分 pd 数据帧。

我想创建一个回归器(前 SVM,或线性回归器),以如下格式对这些标签进行预测:70% 步行,25% 慢速,0% 运行,5% 保持。

它必须是概率的,我尝试使用分类器,并将标签组合成一个变量,但现在我正在尝试概率机会。

使用 sklearn 库可以做到这一点,如果可以,怎么做?我想不通。

【问题讨论】:

【参考方案1】:

分类器已经是概率性的 - 您可以获得概率,而不仅仅是最高概率的类别。使用 predict_proba :

clf.fit(X_train, y_train)
score = clf.score(X_test, y_test)
probs = clf.predict_proba(X_test)

【讨论】:

谢谢!像魅力一样工作:)

以上是关于具有多个标签的 sklearn 确定性回归的主要内容,如果未能解决你的问题,请参考以下文章