我正在寻找一种方法来使用 Telegraf 和 InfluxDB 监控 Kubernetes pod 指标的“CPU Throttling”

Posted 2023-02-16

技术标签:

【中文标题】我正在寻找一种方法来使用 Telegraf 和 InfluxDB 监控 Kubernetes pod 指标的“CPU Throttling”【英文标题】：I am looking for a way to monitor Kubernetes pod metrics for "CPU Throttling" using Telegraf and InfluxDB 【发布时间】：2021-03-15 15:52:37 【问题描述】：

我正在寻找一种能够使用 Telegraf、InfluxDB 作为我的 TSD 和 Grafana 来监控 Kubernetes pod“CPU Throttling”指标的方法。

无论出于何种原因，我似乎只发现 Prometheus 提供了这个指标。我在这里错过了什么？

【问题讨论】：

【参考方案1】：

查看cgroups 输入。

电报配置：

 [[inputs.cgroup]]
   paths = [
     "/sys/fs/cgroup/cpu",              # root cgroup
     "/sys/fs/cgroup/cpu/*",            # all container cgroups
     "/sys/fs/cgroup/cpu/*/*",          # all children cgroups under each container cgroup
   ]
   files = ["cpu.stat"]

您要查找的指标来自cpu.stat file：

nr_periods – cgroup 中任何线程可运行的周期数 nr_throttled – 应用程序使用其全部配额并受到限制的可运行周期数

根据您的集群大小（容器数量），您可能很快就会处理high cardinality issue。

【讨论】：

以上是关于我正在寻找一种方法来使用 Telegraf 和 InfluxDB 监控 Kubernetes pod 指标的“CPU Throttling”的主要内容，如果未能解决你的问题，请参考以下文章

使用opencv获取（内边缘）轮廓像素

用 Jest 测试 NestJs 服务

一遍又一遍地运行相同的junit测试的简单方法？

使用 Telegraf 的 influxDB 数据在 Grafana 上绘制 CPU 使用率百分比

我正在寻找一种从字符串构建 IQueryable 查询的方法

使 cordova.exec 同步