运维之监控系统实践
Posted 运维的自我修养
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了运维之监控系统实践相关的知识,希望对你有一定的参考价值。
一、监控的分类
- 基础资源监控系统:
- zabbix
- open-falcon
- n9e(夜莺)
- prometheus (CNCF)
- cacti
- nagions
- ganglia
- 应用程序监控(APM): Pingpoint ,Twitter的Zipkin,美团的CAT 商业化厂商: 听云
- 日志监控: ES / 自研
二、监控系统(我们在用什么?)
- open-falcon
- zabbix
- prometheus
- n9e(夜莺)
zabbix 架构:
图片来自: https://www.jianshu.com/p/5bdeb896af08
open-falcon架构(图片来自官网):
图片来自: https://www.jianshu.com/p/210dc70b493e
n9e架构(图片来自官网):
prometheus 架构(图片来自官网):
【说明】摘自prometheus监控实践第二章
三、经典案例(我们怎么用?)
- zabbix lld 功能 (mysql 自动发现案例)
- open-falcon expression ( 状态码案例 )
- es-mon
- es-mon
- grafana + zabbix
- n9e 大盘,环比功能,指标聚合
四、监控系统整体对比
⚠️: 本文编写于2020年,由于本人水平有限,难免会存在不合理的地方,欢迎指正。
以上是关于运维之监控系统实践的主要内容,如果未能解决你的问题,请参考以下文章