机器学习二分类

Posted

技术标签:

【中文标题】机器学习二分类【英文标题】:machine learning binary classification 【发布时间】:2021-04-14 03:40:04 【问题描述】:

我正在尝试使用多层感知器进行二进制分类。

基本上是句子的情感分析。目前只有二进制。正面与负面(目前我的数据中没有中性),所以它是二元的。

我发现一件奇怪的事情是,当正编码为 1(正=1,负=0)和负编码为 1(正=0)时,性能(准确率、召回率、精度、f1 分数)有很大不同, 负数=1)。当然,我使用了相同的 X 数据集和相同的模型(架构)。仅更改了标签编码。

当正例编码为 1 时,平均 f1 分数约为 89。(我运行相同的模型 10 次) 当负例编码为 1 时,平均 f1 分数约为 50。(我运行相同的模型 10 次)

我对这个结果感到很困惑。我认为应该没有任何显着差异。

【问题讨论】:

【参考方案1】:

F1-score 是准确率和召回率的调和平均值,其公式为:

TP/(TP + 1/2(FP + FN))。更多细节在这里:https://en.wikipedia.org/wiki/F-score。

因此,您可以观察到公式中没有太多对称性,并且偏向于真阳性。准确性如何?

【讨论】:

非常感谢您的解释。准确度数字非常相似

以上是关于机器学习二分类的主要内容,如果未能解决你的问题,请参考以下文章

关于机器学习二分类建模的一些代码

机器学习01 二分类问题(随机梯度下降法)

机器学习多分类二分类回归问题数据集分享

机器学习基础:理解逻辑回归及二分类多分类代码实践

使用机器学习和深度学习对PE进行二分类和多分类

机器学习——监督分类MLP 二分类的不确定估计