Python scikit learn中分类和回归分数的区别

Posted

技术标签:

【中文标题】Python scikit learn中分类和回归分数的区别【英文标题】:Difference between classification and regression score in Python scikit learn 【发布时间】:2014-06-19 19:49:38 【问题描述】:

我是 python scikit learning 的新手,我使用 scikit learn 分类方法开发了一种数据挖掘算法,现在我需要找到它的准确性。首先只需要知道,

Python scikit learn 中的分类和回归分数有什么区别?

还有其他方法可以计算我的预测算法的准确性吗?

r2_score(y_test,predictions)
f1_score(y_test,predictions)

Regression score (%)== 66%
Classification score (%) == 75%

【问题讨论】:

假设你有一些训练和测试数据,在训练数据上构建你的模型,然后运行 ​​algo = clf.fit()(Y_test == algo.predict(X_test)).mean() 之类的东西。这将为您提供准确性。查看sklearn.metrics.mean_absolute_errorsklearn.metrics.mean_squared_error 但我已经使用 r2_score(y_test,predictions) f1_score(y_test,predictions) 评估了我的算法,我只想知道分类和回归分数之间的区别? 你了解分类和回归的区别吗? 这个问题对我来说没有任何意义,有很多方法可以评估回归和分类问题。您想知道 r-squared 和 f1 之间的区别吗?如果是这样,阅读文档和/或***应该会为您解答。无论如何,我看不出这是一个适合 *** 的编程问题,所以我不赞成。 分类树具有分类和无序的因变量。回归树的因变量是连续值或有序整数值。 【参考方案1】:

回归:输出变量取连续值。

分类:输出变量采用类标签。

将根据连续值和类标签的结果计算分数

【讨论】:

以上是关于Python scikit learn中分类和回归分数的区别的主要内容,如果未能解决你的问题,请参考以下文章

带权重的 Scikit-Learn 分类和回归

Python SciKit Learn 和 Pandas 分类数据

R 和 scikit-learn 在分类任务中与逻辑回归的比较

scikit-learn,线性回归中的分类(但数字)特征

机器学习包Scikit-learn

Scikit-Learn 逻辑回归严重过拟合数字分类训练数据