关于 Nan 值的 Prometheus 警报

Posted

技术标签:

【中文标题】关于 Nan 值的 Prometheus 警报【英文标题】:Prometheus alert on Nan values 【发布时间】:2020-02-10 23:19:25 【问题描述】:

所以我使用节点导出器的文本文件收集器创建了一个自定义指标,它检查数据库的大小,如果找不到当天的数据库备份,它会返回 Nan 作为值。 所以我的指标看起来像这样。

custom_cronjob_db_size database="prod" Nan

现在我正在尝试提醒该值是否为 Nan。为了测试我的表达,我去了 Prometheus 网络界面并尝试了这个:

custom_cronjob_db_size == Nan

这不起作用,即使 custom_cronjob_database_backup_size 的值在 web 界面中显示 Nan。

我该如何提醒?

【问题讨论】:

【参考方案1】:

NaN 是一个特殊的浮点值,0/1 布尔值会更简单。但是你可以通过custom_cronjob_db_size != custom_cronjob_db_size 来检测它。

【讨论】:

以上是关于关于 Nan 值的 Prometheus 警报的主要内容,如果未能解决你的问题,请参考以下文章

如何使用 Prometheus 来提醒特定的错误信息?

关于缺失系列/数据的警报

关于undefined,null,NaN,以及引用值的一点小记

Prometheus 警报管理器 - CPU 高不警报

向 Microsoft 团队发出警报管理器/prometheus 警报

Prometheus 警报管理器不发送警报 k8s