架构设计之日志监控与告警

Posted 我爱coding

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了架构设计之日志监控与告警相关的知识,希望对你有一定的参考价值。

记录日志的作用

  1. 方便排查异常错误。
  2. 数据分析统计。

什么场景需要做日志

  1. 核心功能模块。
  2. 不稳定、新接入的服务。

日志如何做记录

  1. 按级别记录,比如 errror 级别, notice 级别。
  2. 并发量比较小时可用文件日志,如果并发比较大,可以通过消息队列。

如何做好监控

  1. 基于 API 监控,实现方式:定时请求某个接口,是否能够正常响应。
  2. 基于服务监控,比如数据库服务,定时跑脚本检测服务或端口是否存在。
  3. 基于系统监控,监控系统负载,CPU 使用率,内存使用率。
  4. 基于日志监控,定时监控某个路径下的日志文件,如果有修改或写入,则触发告警。
告警有哪些形式
  1. 邮件
  2. 短信
  3. 微信
  4. 钉钉
  5. 第三方服务

什么级别需要触发告警

  1. 核心功能,如果告警太多,会导致无视告警的通知。

降级预案

  1. 设置开关,如果服务短时间内无法快速修复,可提前做好开关,实现不影响整个系统提供服务。
  2. 容错机制,提前准备备用服务,比如发送短信,A 公司的短信服务不可用,那么可以使用 B 公司的短信服务。


以上是关于架构设计之日志监控与告警的主要内容,如果未能解决你的问题,请参考以下文章

架构设计笔记_18_关键模式_监控体系

90行代码,搞定日志监控框架

Zabbix中小型企业Zabbix监控实战之告警大全

设计一个靠谱的监控告警平台

搭建一个通用监控告警平台,架构上需要有哪些设计

运维道中道之“Shell脚本日志关键字监控+告警”