普罗米修斯统计查询

Posted

技术标签:

【中文标题】普罗米修斯统计查询【英文标题】:Prometheus statistic query 【发布时间】:2020-05-28 21:17:06 【问题描述】:

我正在尝试使用 prometheus-grafana-alertmanager-blackbox_exporter 进行黑盒监控。 我的问题是: 我在一个集群中有很多实例。所以我把它标记为

probe_successcluster="cluster-1", instance="instance-1"

probe_successcluster="cluster-1", instance="instance-2"

现在我只想计算最近 30m 的范围内,cluster-1 上的 probe_success 指标返回值 1 或 0 的次数。 普罗米修斯真的不能做这件事吗?我找不到任何有关它的文档或问题

【问题讨论】:

【参考方案1】:

你想做的事叫做aggregation over time。在您的情况下,它将是过去 30 分钟内指标的总和:

sum_over_time(probe_success[30m])

请注意,您正在计算的内容很难执行,因为它取决于过去 30 分钟内的抓取次数。原因是如果 exporter 或 Prometheus 宕机(意味着没有产生任何指标),或者如果您更改 Prometheus 中的抓取间隔,则该值的含义会​​发生变化。

通常最好使用avg_over_time 来表示应用程序在过去 30 分钟内可测量的时间百分比。

【讨论】:

以上是关于普罗米修斯统计查询的主要内容,如果未能解决你的问题,请参考以下文章

加入两个普罗米修斯查询

了解用于内存空闲的普罗米修斯查询(节点导出器)

ProxyError,尝试在代理后面查询普罗米修斯时

grafana 使用基于指标的普罗米修斯查询定义变量

普罗米修斯与正则表达式查询不匹配

普罗米修斯查询中来自grafana变量的多个值