Prometheus 警报总和 1 个标签但输出 2 个标签

Posted

技术标签:

【中文标题】Prometheus 警报总和 1 个标签但输出 2 个标签【英文标题】:Prometheus Alert sum by 1 label but output 2 labels 【发布时间】:2021-04-24 14:40:37 【问题描述】:

有一个具有“主机”和“错误”标签的指标(直方图)。该值是错误所花费的时间。每当主机的错误摘要得到一定程度时,我都需要提醒。表达效果很好

sum by(host)(some_metric_sum / some_metric_sum_count) > 60

但是这个表达式只返回带有host 标签的值。但我也需要有error 标签。有什么方法可以将表达式中求和的错误标签加入并输出?

【问题讨论】:

嗨,回复 devops.stackexchange.com/questions/13163/… - 请避免在多个 SE 网站上交叉发布相同的问题 - 请参阅 meta.***.com/tags/cross-posting/info 谢谢,我刚刚从那里删除了问题。 【参考方案1】:

用途:

sum by (host, error) (some_metric_sum / some_metric_sum_count) > 60

【讨论】:

但这样它会按每个独特的错误求和。我需要总结特定主机的所有错误。是否可以输出(主机和错误)标签,但汇总主机的所有错误? 不,这是不可能的。

以上是关于Prometheus 警报总和 1 个标签但输出 2 个标签的主要内容,如果未能解决你的问题,请参考以下文章

如何使用 Grafana 警报显示 Prometheus 标签

如何在 Prometheus 警报中匹配多个标签?

Prometheus 抑制但没有匹配的实例标签

prometheus alertmanager 规则的自动标签

Prometheus 警报是 expr 检查最后一个值吗?

Prometheus 按标签查询范围向量