如何将Prometheus仪表板添加到Grafana
Posted a00ium
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何将Prometheus仪表板添加到Grafana相关的知识,希望对你有一定的参考价值。
Grafana是可视化的时间序列的基础设施和应用程序指标领先的图形和仪表盘构建的,但在许多其他领域,包括工业传感器,家庭自动化,天气和过程控制使用。它为您的团队和全世界提供了一种强大而优雅的方式来创建,探索和共享仪表板和数据。
在本教程中,您将学习如何将Prometheus作为数据源添加到Grafana实例并安装预配置的Prometheus Server Statistics仪表板。
先决条件
要学习本教程,您需要:
- Ubuntu 14.04 Droplet
- 具有sudo访问权限的用户(有关详细信息,请参阅Ubuntu 14.04初始服务器设置教程)
- Prometheus和Grafana 2.5+与Ubuntu 14.04上如何使用Docker安装Prometheus的说明一起安装
第1步 - 添加Prometheus作为Grafana数据源
在本节中,我们将配置Grafana以将Prometheus服务器作为数据源进行访问。每个Prometheus服务器都是一个单独的数据源,如果您要配置多个Prometheus服务器,请为每个服务器重复此部分。
转到Grafana主视图,然后登录您的管理员帐户。http://your_server_ip:3000/
单击左上角的Grafana图标以显示主菜单。选择“ 数据源”以导航到数据源列表页面。单击顶部导航栏中的“ 添加新项 ”。你应该看到以下内容:
使用以下值创建新数据源:
Name
:普罗米修斯Type
:普罗米修斯URL
:http:// <your_server_ip>:9090,(默认端口为9090)Access
: 代理Basic Auth
:已启用或已禁用,因为已配置Prometheus服务器。
单击“ 添加”以添加数据源,然后单击“ 测试连接”以验证一切正常。如果成功,请继续执行下一步以导入仪表板。
第2步 - 导入Prometheus Stats仪表板
本节将下载一个预先构建的官方Prometheus Stats仪表板,并指导您如何将其导入Grafana。
下载最新的Prometheus Dashboard有两种方法:
- 右键单击并保存以下链接:Prometheus Stats - 默认Grafana仪表板
- 将浏览器直接导航到仪表板JSON文件:
http://grafana.org/assets/dashboards/prometheus-dash.json
导入视图可在“仪表板选取器”下拉列表中找到,位于“新建仪表板”和“播放列表”按钮旁边。
要从本地JSON文件导入仪表板,请单击“ 导入文件”部分中的“ 选择文件”按钮。prometheus-dash.json
在本地文件系统上找到下载的内容,然后导入它。
注意:如果您已将数据源命名为其他内容Prometheus
,则需要执行查找并替换.json
文件中的数据源名称。打开它:
- nano prometheus-dash.json
找到以下内容,并将数据源文件名从Prometheus更改为您命名的内容:
"datasource": "Prometheus",
导入Prometheus仪表板后,您将立即进入Prometheus Stats仪表板,如果一切配置正确,您将开始查看Prometheus服务器的统计信息。
重要提示:单击顶部菜单中的“保存”按钮,将仪表板保存在Grafana实例中。如果您不保存仪表板,则在关闭浏览器后它不会出现在您的Grafana中。
第3步 - 查看Prometheus Stats仪表板
成功导入后,您将立即被带到新的未保存的仪表板。此仪表板是在Prometheus团队的帮助下构建的,突出显示了常用于排除Prometheus服务器故障的基本指标。
各个小组和报告的指标如下:
单个统计图
-
正常运行时间:此单个统计图表是正常运行时间或自Prometheus服务器联机以来的时间。一目了然,这个统计信息对于了解您的服务器最近是否已重新启动非常有用。
-
本地存储内存系列:此面板显示内存中保存的当前系列数,截至
From
仪表板时间范围指定的值。默认情况下,这是now
。 -
内部存储队列长度:理想情况下,此队列长度应为空(0)或低数。
-
Sample Ingested:此图表显示Prometheus服务器摄取的样本数,在过去5分钟内测量,每个时间序列在范围向量中。在对IRC或Github上的问题进行故障排除时,这通常是Prometheus团队要求的第一个统计数据。此数字应与您认为正在摄取的指标数量一致。
该样本摄入的查询如下:
rate(prometheus_local_storage_ingested_samples_total[5m])
擦伤
Prometheus直接或通过中间推送网关从仪表工作中删除指标,用于短期工作。该目标擦伤图将展示如何频繁目标,因为在距矢量在最后5分钟测量,每个时间序列刮。“ 刮擦持续时间”图表将显示擦除所用的百分位数作为序列可用的时间。刮擦持续时间显示第50百分位数(0.5),第90百分位数(0.9)。和99百分位数(0.99)作为三个独立的系列,以帮助识别可能扭曲数据的异常值。
该目标擦伤查询如下:
rate(prometheus_target_interval_length_seconds_count[5m])
该刮时间查询如下:
prometheus_target_interval_length_seconds{quantile!="0.01", quantile!="0.05"}
规则评估持续时间
此图形面板绘制了要执行的所有评估的持续时间。第50百分位数(0.5),第90百分位数(0.9)和第99百分位数(0.99)显示为三个单独的系列,以帮助识别可能使数据偏斜的异常值。
第4步 - 分析Prometheus仪表板中的数据
对于新运行的Prometheus服务器,您的图形应该看起来非常扁平和小。
从长远来看,这些图表将根据您的特定用例和工作负载而有很大差异。通常,您希望所有这些图形保持稳定。如果正在刮取更多目标和/或他们开始导出更多指标,那么每秒摄取的样本数,内存系列数和目标数量将会增加 - 这是可以预期的。
如果您的目标刮擦意外下降或刮擦延迟增加,您应该确定原因。例如,客户端可以开始导出100万个指标而不是通常的1万个指标,或者有人可以为每个用户导出具有不同标签的时间序列。这两者都会导致刮擦延迟增加。因此,当图形突然上升时,您应该调查应用程序是否只是显着放大或是否可能被严重检测。
慢速规则评估也是一个很好的指标,Prometheus服务器运行的节点根本不足以处理负载。
第5步 - 自定义图形和指标
现在,您已经在Grafana实例中添加了一个Prometheus仪表板,其中包含一组预配置的Prometheus服务器统计信息。
Grafana使您能够可视化Prometheus服务器上可用的任何指标 - 所有指标均可在专业的Prometheus查询编辑器中访问。要在任何面板上访问查询编辑器,请单击面板标题区域以显示面板菜单。单击编辑。将为您预先选择“ 度量标准”选项卡,并提供对Prometheus数据源的查询和可用选项的直接访问。
在查询编辑器中进行更改后,图表将立即更新以显示您的编辑内容。
结论
有关可用指标的完整列表,您可以导航到http:// <your_server_ip>:9090
/ metrics(默认端口9090)。
可以将这些指标中的任何一个复制并粘贴到Grafana查询编辑器中,直到您保存仪表板,您的所有编辑都不会覆盖现有的仪表板。
以上是关于如何将Prometheus仪表板添加到Grafana的主要内容,如果未能解决你的问题,请参考以下文章
stable/prometheus-operator - 添加持久的 grafana 仪表板
如何在 Kubernetes Dashboard 中获取 Prometheus 数据