哪个类是积极的,以及如何在为ML准备数据时确定真正的警报

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了哪个类是积极的,以及如何在为ML准备数据时确定真正的警报相关的知识,希望对你有一定的参考价值。

我正在为机器学习准备一些数据。这个问题很容易,但我有点困惑。

假设有一个系统每1小时有大约100个警报,只有1或2个警报是它们的真正警报。人类会忽略假警报。我已经收集了一些看起来像功能的数据,并给出假的或真正的警报标签0或1。

在这种情况下,真正的警报是0还是1?这样,TP,TN,FP,FN,机会等级就会改变。我们感兴趣的是真正的警报,即使手动检查所有警报,我们也不想错过它。

几乎警报是假的,所以机会水平将超过95%。然后主要班级和积极班级将是1和假警报?但我们的兴趣不是假警报。在这种情况下我应该如何设置标签?

答案

两种方式对模型的性能同样可以,因为损失函数不受标记1或0的方式的影响。就个人而言,我认为0应该用于伪造的,1用于实际的。

以上是关于哪个类是积极的,以及如何在为ML准备数据时确定真正的警报的主要内容,如果未能解决你的问题,请参考以下文章

如何为包含大量异常值的 ML 分类任务准备 IOT 数据?

如何将实体主键映射到 Spark ML 预测?

如何从 lib .so 文件中查找函数?

我可以在为 bigquery 做准备时对谷歌云 sql 中的数据进行非规范化吗

不确定如何训练 ML 模型来识别静态图像

ML Metadata:ML 的版本控制