重塑 Prometheus 的 Nomad 指标

Posted

技术标签:

【中文标题】重塑 Prometheus 的 Nomad 指标【英文标题】:Reshaping Nomad metrics for Promethus 【发布时间】:2021-10-26 01:05:35 【问题描述】:

我正在尝试为我们的集群实施新的 Nomad Autoscaler 工具,以便他们可以根据需要扩展 EC2 实例,并且我们已经在集群的所有节点上配置了 Prometheus,因此我们可以从 Nomad 获取指标。但是,这些指标对于 EC2 实例或作业分配是非常独特的,下面是一个示例。

nomad_client_allocated_memory_18d612fa_c7bb_aa80_e0ae_ac353814fce8_dev_2_service_data_ready_eligible

如您所见,指标名称具有赋予节点的唯一 ID 以及集群名称和类型。

有没有办法将这些指标重新塑造成更有用的东西,并且在多种环境中都能很好地工作?

这样的东西对我来说是一个理想的指标。

nomad_client_allocated_memory_data_ready_eligible

我花了一天的时间试图找到有关这方面的任何文档,但到目前为止,我只看到了如何添加标签,而不是重塑指标名称本身。

如果有人能指出这方面的良好文档也将非常有用,因为我对 Prometheus 不是很熟悉。

如果您需要更多信息,请告诉我,非常感谢您的帮助。

提前致谢

【问题讨论】:

【参考方案1】:

将 Nomad 代理配置的遥测节中的“disable_hostname”选项设置为 true。默认为假。

https://www.nomadproject.io/docs/configuration/telemetry#disable_hostname

【讨论】:

以上是关于重塑 Prometheus 的 Nomad 指标的主要内容,如果未能解决你的问题,请参考以下文章

如何将指标直接推送到 Cortex

Prometheus 和 Node 导出器(以毫秒为单位)

prometheus 常用指标

所有可用指标的 Prometheus 端点

Prometheus - 计算给定指标标签的指标增加

Prometheus 指标没有给出路径变量值