k8s-prometheus disk

Posted 芒果牛奶

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了k8s-prometheus disk相关的知识,希望对你有一定的参考价值。

prometheus 存储


磁盘上的布局
摄入的样品分为两个小时。每个两个小时的时间段包含一个目录,该目录包含一个或多个块文件,该文件包含该时间窗口的所有时间序列样本,以及元数据文件和索引文件(用于将度量名称和标签索引到块文件中的时间序列) )。
通过API删除系列时,删除记录存储在单独的逻辑删除文件中(而不是立即从块文件中删除数据)。

当前传入样本的块保留在内存中,尚未完全保留。Prometheus服务器在崩溃后重新启动时,可以通过预写日志(WAL)防止崩溃,从而防止崩溃。
预写日志文件wal以128MB的段存储在目录中。这些文件包含尚未压缩的原始数据,因此它们比常规的块文件大得多。
Prometheus将至少保留3个预写日志文件,但是高流量服务器可能会看到三个以上的WAL文件,因为它需要保留至少两个小时的原始数据。



压实
最初的两个小时的块最终会在后台压缩为更长的块。
压缩将创建更大的块,最多占租用时间的10%,即21天,以较小者为准。


参数
--storage.tsdb.path:这确定Prometheus在何处写入其数据库。默认为data/。
--storage.tsdb.retention.time:这确定何时删除旧数据。默认为15d。storage.tsdb.retention如果此标志设置为默认值以外的任何值,则覆盖。
--storage.tsdb.retention.size:[EXPERIMENTAL]这确定存储块可以使用的最大字节数(请注意,这不包括WAL大小,这可能是很大的)。最旧的数据将首先被删除。默认为0或禁用。该标志是实验性的,可以在将来的版本中进行更改。支持的单位:KB,MB,GB,PB。例如:“ 512MB”
--storage.tsdb.retention:已弃用此标志,而推荐使用storage.tsdb.retention.time。
--storage.tsdb.wal-compression:此标志启用预写日志(WAL)的压缩。根据您的数据,您可以预期WAL大小将减少一半,而额外的CPU负载却很少。请注意,如果启用此标志,然后将Prometheus降级到2.11.0以下的版本,则您将需要删除WAL,因为它将不可读。


平均而言,普罗米修斯每个样本仅使用大约1-2个字节。因此,要计划Prometheus服务器的容量,可以使用以下粗略公式:
needed_disk_space = retention_time_seconds * ingested_samples_per_second * bytes_per_sample

要调整每秒摄取的样本的速率,可以减少抓取的时间序列数(每个目标更少的目标或更少的序列),或者可以增加抓取时间间隔。但是,由于压缩序列中的样本,减少序列数可能更有效。
例如:
需要监控的节点集合为 $$nodes={i|i>0}$$              7
节点 i 上的测量点的数目为 $$metrics(i)$$             50
对节点 i 的抓取时间间隔为 $$interval(i)$$,          15s
retention_time_seconds: 15d*24h*60min*60s
ingested_samples_per_second: 1/scrape_interval = 1/15s


needed_disk_space = 15d*24h*60min*60s * 1/15s * 1-2/byte * 7 * 50 = 60480000/byte /1024/1024 =57.678MB

以上是关于k8s-prometheus disk的主要内容,如果未能解决你的问题,请参考以下文章

k8s-prometheus

配置 kafka 同步刷盘

函数“alloc_disk”的隐式声明

如何使用 Yandex Disk c# Api

Enable Azure Disk Encryption for Windows Notes

如何验证 Redshift 真的是 DISK FULL?