Kubernetes Prometheus:当容器内存使用量大于 kube 节点总内存容量时添加警报

Posted

技术标签:

【中文标题】Kubernetes Prometheus:当容器内存使用量大于 kube 节点总内存容量时添加警报【英文标题】:Kubernetes Prometheus: Add alert when container memory usage is greater than total kube node memory capacity 【发布时间】:2020-05-16 06:48:04 【问题描述】:

我正在使用 Prometheus 监控多个 Kubernetes 集群。

我想要一个在容器总内存使用量超过或等于 kube 节点总内存容量时触发的警报规则。

我构建的内容如下:

sum(container_memory_usage_bytesinstance=~"sa.*.domain") >= sum(kube_node_status_capacity_memory_bytesnode=~"sa.*.domain")

但是在 Prometheus GUI 的表达式求值器中,当我测试这个表达式时,我得到了一个数值。

有人可以帮我正确表达吗?

提前致谢。

最好的问候, rforberger

【问题讨论】:

您是否添加了以下查询作为警报规则? prometheus.io/docs/prometheus/latest/configuration/… @KFC_ 不,我还没有将它添加为警报规则。你认为这个规则有效吗? 【参考方案1】:

我已经重建了查询,并且对此有疑问。我将打开另一个问题。

【讨论】:

那么,这个问题还没有解决吗?如果没有,请您删除它吗? @MarcABOUCHACRA 我回答了我自己的问题,所以现在应该关闭。

以上是关于Kubernetes Prometheus:当容器内存使用量大于 kube 节点总内存容量时添加警报的主要内容,如果未能解决你的问题,请参考以下文章

Kubernetes 集群和应用监控方案的设计与实践

当 docker 容器 pod 处于 Error 或 CarshLoopBackOff kubernetes 时发出警报

kubernetes1.23.1部署prometheus-operator

Prometheus的工作原理是啥?

Prometheus Operator - 每天5分钟玩转 Docker 容器技术(177)

云上Prometheus监控运维最佳实践