怎么样做好日志类的报警监控

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了怎么样做好日志类的报警监控相关的知识,希望对你有一定的参考价值。

上一篇文章写了普通数字类型类型的监控报警,本文谈一下怎么样做好日志类的监控和报警

一、日志类报警的特点

   1、接受人员希望直接看到日志的内容;

   2、对应技术栈涉及比较广的系统,,一个问题会引发不同主机上面不同系统同时产生日志。举例:openstack 的nova在保存快照时出错,会引起nova-api,galnce-api,horizen同时产生错误日志。

二、遇到的痛点:

    1、有很多人想随时查看日志,不同的人想要查看不同的日志;

    2、日志类的报警,不适合用微信直接发送内容,原因一是转义麻烦,二是微信的消息长度有限制;

    3、日志类的报警,报警风暴很多,往往一来一大波,但是很难对报警风暴进行聚合;

    4、往往在收到报警时候,接警人员想同时看看同一个时间点其他系统的日志;

    5、kibana的用户鉴权是收费用户,同时将kibana映射到公网给运维人员似乎很不靠谱。

三、解决方案

    1、kibana的手机化,kibana是个非常棒的前端展示平台,如果有个类似的平台能手机化,在手机上实现随时查看、检索、报警推送,那简直完美。

    2、自己写一个小型的系统,来实现日志的报警,展示,用户鉴权等基本功能

四、一些成果

    技术分享

本文出自 “老安的博客” 博客,谢绝转载!

以上是关于怎么样做好日志类的报警监控的主要内容,如果未能解决你的问题,请参考以下文章

怎么修改zabbix磁盘空间报警的默认值

zabbix 监控服务 怎么触发三次在报警

当日志文件中的时间与主机时间不同步时,怎么监控每隔五分钟检测一次日志文件是否出自按某个关键字?

ELK+zabbix监控tomcat报警及错误日志--报警

2. 怎么根据nagios报警做出调整的

DB常见问题排查方法