机器学习二分类
Posted
技术标签:
【中文标题】机器学习二分类【英文标题】:machine learning binary classification 【发布时间】:2021-04-14 03:40:04 【问题描述】:我正在尝试使用多层感知器进行二进制分类。
基本上是句子的情感分析。目前只有二进制。正面与负面(目前我的数据中没有中性),所以它是二元的。
我发现一件奇怪的事情是,当正编码为 1(正=1,负=0)和负编码为 1(正=0)时,性能(准确率、召回率、精度、f1 分数)有很大不同, 负数=1)。当然,我使用了相同的 X 数据集和相同的模型(架构)。仅更改了标签编码。
当正例编码为 1 时,平均 f1 分数约为 89。(我运行相同的模型 10 次) 当负例编码为 1 时,平均 f1 分数约为 50。(我运行相同的模型 10 次)
我对这个结果感到很困惑。我认为应该没有任何显着差异。
【问题讨论】:
【参考方案1】:F1-score 是准确率和召回率的调和平均值,其公式为:
TP/(TP + 1/2(FP + FN))。更多细节在这里:https://en.wikipedia.org/wiki/F-score。
因此,您可以观察到公式中没有太多对称性,并且偏向于真阳性。准确性如何?
【讨论】:
非常感谢您的解释。准确度数字非常相似以上是关于机器学习二分类的主要内容,如果未能解决你的问题,请参考以下文章