如何评估无监督异常检测

Posted

技术标签:

【中文标题】如何评估无监督异常检测【英文标题】:How to evaluate unsupervised anomaly detection 【发布时间】:2020-06-02 05:15:40 【问题描述】:

我正在尝试通过使用机器学习预测连续值来解决回归问题。我有一个由 6 个浮点列组成的数据集。

数据来自低价传感器,这说明我们很可能会拥有可以被认为与众不同的值。为了解决这个问题,在预测我的连续目标之前,我会预测数据异常,并将他用作数据过滤器,但是我拥有的数据没有标记,这意味着我有无监督异常检测问题。

用于此任务的算法是Local Outlier Factor、One Class SVM、Isolation Forest、Elliptic Envelope 和 DBSCAN。

在拟合了这些算法之后,有必要对它们进行评估以选择最佳算法。 谁能知道如何评估用于异常检测的无监督算法?

【问题讨论】:

可能有更好的方法,但是如果您将合成与您的数据相似的数据并人为添加异常并标记它们,您可以评估成功率。 感谢@rotemtal 的回复,但我认为这不是正确的方法,因为在这种情况下,如果我不是该领域的专家,我可能会添加错误的标签我正在努力解决问题。 您找到评估不同异常检测算法的方法了吗?也许this 带有代码here 的论文会有所帮助。 【参考方案1】:

唯一的方法是生成合成异常,这意味着在了解典型异常值的外观的情况下自行引入异常值。

【讨论】:

以上是关于如何评估无监督异常检测的主要内容,如果未能解决你的问题,请参考以下文章

《异常检测——从经典算法到深度学习》18 USAD:多元时间序列的无监督异常检测

《异常检测——从经典算法到深度学习》18 USAD:多元时间序列的无监督异常检测

《异常检测——从经典算法到深度学习》16 基于VAE和LOF的无监督KPI异常检测算法

《异常检测——从经典算法到深度学习》16 基于VAE和LOF的无监督KPI异常检测算法

《异常检测——从经典算法到深度学习》15 通过无监督和主动学习进行实用的白盒异常检测

《异常检测——从经典算法到深度学习》15 通过无监督和主动学习进行实用的白盒异常检测