如何使用 Prometheus 和 Grafana 优雅的实现服务器可视化
Posted 浪尖聊大数据
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何使用 Prometheus 和 Grafana 优雅的实现服务器可视化相关的知识,希望对你有一定的参考价值。
Prometheus 是一个开源监控工具,实现了高维数据模型。Prometheus 有多种数据可视化模式,其中一种是集成 Grafana。Prometheus 以高效的自定义格式将时间序列数据存储在内存和本地磁盘上。
Prometheus 有许多客户端可用于轻松监控服务,也可以轻松创建自定义客户端。每台服务器的可靠性都是独立的,仅依赖本地存储。用 Golang 编程语言编写,所有二进制文件都是静态链接的,易于部署。
Prometheus 采用拉取策略而不是推送策略,即 Prometheus 以一定的时间间隔从 exporter 那里拉取数据,而不是 exporter推送数据到 Prometheus。这种方式有其自身的优点和缺点,但我们不讨论这些细节。
2Grafana 简介Grafana 是一款开源可视化和分析软件,它允许你查询、可视化、提醒和探索您的指标,无论这些指标存储在哪里。Grafana 支持数十种数据库,我们可以创建一个仪表盘来可视化它们全部。
Grafana 还提供报警,直观地定义阀值,并通过 Slack、 PagerDuty 和其他平台获得通知。Grafana 还提供了多种选项来查看我们的数据,从热力图到直方图,从图形到地理地图。Grafana 有大量的可视化选项可以帮助我们更好地理解数据。我正在使用 Ubuntu 18.04,并将显示与其相关的整个配置。
3Prometheus 安装$ wget https://github.com/prometheus/prometheus/releases/download/v2.21.0/prometheus-2.21.0.linux-amd64.tar.gz
$ tar -xzf prometheus-2.21.0.linux-amd64.tar.gz
$ cd prometheus-2.21.0.linux-amd64/
$ ./prometheus
安装非常简单,执行这些命令将会让 Prometheus 服务器在端口 9090 中运行。Prometheus 在端口9090上的仪表板如下图所示:
如前所述,从 Prometheus 中抓取的指标发生在恒定的时间段内,因此可以在路径 /metrics 中查看它们。
这些指标用于形成具有各种聚合函数的复杂表达式,以我们想要的形式进行可视化,这在 promql 的帮助下基本上是可能的。Prometheus 中的图形可视化非常基本,没有提供太多自定义,因此我们将使用 Grafana。
4节点 Exporter 安装$ wget https://github.com/prometheus/node_exporter/releases/download/v1.0.1/node_exporter-1.0.1.linux-amd64.tar.gz
$ tar -xzf node_exporter-1.0.1.linux-amd64.tar.gz
$ cd node_exporter-1.0.1.linux-amd64/
$ ./node_exporter
上述命令将安装节点 exporter 并在端口 9100 上运行,并且可以从 /metrics 扩展中抓取指标。
我创建了 3 个虚拟机并在所有虚拟机中安装了节点 exporter,以提供更好的可视化效果。所以在安装之后,我们必须告诉 Prometheus 从哪里抓取指标,这可以通过编辑 prometheus.yml 文件来完成。我们只需要在 scrape_configs 中添加一个新作业,指定目标中的 IP 地址和端口。在 prometheus.yml 文件中添加目标并重新启动 Prometheus 服务器后,我们可以在仪表板以及 /targets 路径中看到新目标及其状态。
确保所有目标都已启动,如果没有,请检查是否为该 VM 实例开放了 9100 端口。你还可以查看 Prometheus 从每个 exporter 抓取的时间以及上次抓取的时间。
5Grafana 安装$wget https://dl.grafana.com/oss/release/grafana-7.1.5.linux-amd64.tar.gz
$tar -xzf grafana-7.1.5.linux-amd64.tar.gz
$cd grafana-7.1.5.linux-amd64/
$./bin/grafana-server
通过运行上述命令即可完成安装,Grafana 运行在端口 3000。默认的用户名和密码均为“admin”。
当我们进入仪表板,我们需要添加一个数据源,在我们的例子中是 Prometheus。我们只需要提供 Prometheus URL 并点击保存和测试按钮。如果我们看到一个成功的提示框,说数据源正在工作,那么我们就可以开始了。
我们可以使用自定义的查询语句创建自己的仪表板和面板,但这是一项乏味的工作。因此,为了简化我们的工作,其他用户已经创建了一些仪表板,我们可以使用相同的仪表板并根据我们的需要调整表达式。我使用的是 1860 和 405,这些是我们导入仪表板的唯一ID。
导入完成后,我们会看到基于其表达式和时间范围的图表。你可以通过将时间范围减少到 5 分钟来深入了解。
Grafana 还允许我们查看合并多个 exporter的表单,以便更好地进行比较。
所以在上面的图片中,我们可以看到所有三个节点 exporter 的数据都被可视化了。
以上总结了 Prometheus 和 Grafana 的基本设置,用来可视化节点指标数据。如果你觉得有帮助,请点赞分享。
原文链接:https://medium.com/javarevisited/prometheus-grafana-setup-to-visualize-your-servers-924773b83f3f
如何使用 Grafana 警报显示 Prometheus 标签
【中文标题】如何使用 Grafana 警报显示 Prometheus 标签【英文标题】:How to display Prometheus labels with Grafana alert 【发布时间】:2019-07-14 07:42:29 【问题描述】:我正在使用带有 Prometheus 数据源的 Grafana 警报。
一切正常,但我收到这样的通知:
[Alerting] Disk Usage % $instance
Message: Disk usage warning $instance
(请注意我尝试解析警报名称和消息中的 Prometheus 标签值失败。)
要找出哪个实例有内存问题,我必须进入 Grafana。我希望有一种方法可以解决 Grafana 警报通知名称/消息中的 Prometheus 标签。我知道我可以在 Prometheus 中通过花里胡哨的方式执行警报,但我宁愿使用 Grafana 的仪表板配置我的警报,这对于这一理想功能来说似乎已经足够了。
【问题讨论】:
您能否将一个警报/配置共享为(模糊的)屏幕截图?因为我很确定我的 Grafana 警报包含跨越相应警报阈值的特定行的图例属性名称 【参考方案1】:看起来当前的 Grafana 版本 v7.1.5 不支持它: https://github.com/grafana/grafana/issues/5848
【讨论】:
以上是关于如何使用 Prometheus 和 Grafana 优雅的实现服务器可视化的主要内容,如果未能解决你的问题,请参考以下文章
如何使用 Grafana 警报显示 Prometheus 标签
如何在使用 grafana 和 prometheus-operator 时配置电子邮件警报
如何使用 Prometheus 和 Grafana 优雅的实现服务器可视化
如何配置 Grafana 以捕捉 Prometheus 指标的急剧下降?