运维之监控系统实践

Posted 运维的自我修养

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了运维之监控系统实践相关的知识,希望对你有一定的参考价值。

一、监控的分类

  • 基础资源监控系统:
    • zabbix
    • open-falcon
    • n9e(夜莺)
    • prometheus (CNCF)
    • cacti
    • nagions
    • ganglia
  • 应用程序监控(APM): Pingpoint ,Twitter的Zipkin,美团的CAT 商业化厂商: 听云
  • 日志监控: ES / 自研

二、监控系统(我们在用什么?)

  • open-falcon
  • zabbix
  • prometheus
  • n9e(夜莺)

zabbix 架构:
image
图片来自: https://www.jianshu.com/p/5bdeb896af08

open-falcon架构(图片来自官网):
image

image

图片来自: https://www.jianshu.com/p/210dc70b493e

n9e架构(图片来自官网):
image

prometheus 架构(图片来自官网):
image

image
【说明】摘自prometheus监控实践第二章

三、经典案例(我们怎么用?)

  • zabbix lld 功能 (mysql 自动发现案例)
  • open-falcon expression ( 状态码案例 )
    • es-mon
      image
  • grafana + zabbix
  • n9e 大盘,环比功能,指标聚合

四、监控系统整体对比

image

⚠️: 本文编写于2020年,由于本人水平有限,难免会存在不合理的地方,欢迎指正。

以上是关于运维之监控系统实践的主要内容,如果未能解决你的问题,请参考以下文章

新IT运维时代 | Docker运维之最佳实践-下篇

企业运维之 zabbix 监控部署--监控应用

企业运维之 zabbix 监控部署--监控应用

企业运维之 zabbix 监控部署--监控主机

企业运维之 zabbix 监控部署--监控主机

Windows运维之道——系统安装