使用Zabbix监控ZooKeeper服务的健康状态

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了使用Zabbix监控ZooKeeper服务的健康状态相关的知识,希望对你有一定的参考价值。

一 应用场景描述

在目前公司的业务中,没有太多使用ZooKeeper作为协同服务的场景。但是我们将使用Codis作为Redis的集群部署方案,Codis依赖ZooKeeper来存储配置信息。所以做好ZooKeeper的监控也很重要。


二 ZooKeeper监控要点

系统监控

内存使用量    ZooKeeper应当完全运行在内存中,不能使用到SWAP。Java Heap大小不能超过可用内存。

Swap使用量    使用Swap会降低ZooKeeper的性能,设置vm.swappiness = 0

网络带宽占用   如果发现ZooKeeper性能降低关注下网络带宽占用情况和丢包情况,通常情况下ZooKeeper是20%写入80%读入

磁盘使用量    ZooKeeper数据目录使用情况需要注意

磁盘I/O      ZooKeeper的磁盘写入是异步的,所以不会存在很大的I/O请求,如果ZooKeeper和其他I/O密集型服务公用应该关注下磁盘I/O情况


ZooKeeper监控

zk_avg/min/max_latency    响应一个客户端请求的时间,建议这个时间大于10个Tick就报警

zk_outstanding_requests        排队请求的数量,当ZooKeeper超过了它的处理能力时,这个值会增大,建议设置报警阀值为10

zk_packets_received      接收到客户端请求的包数量

zk_packets_sent        发送给客户单的包数量,主要是响应和通知

zk_max_file_descriptor_count   最大允许打开的文件数,由ulimit控制

zk_open_file_descriptor_count    打开文件数量,当这个值大于允许值得85%时报警

Mode                运行的角色,如果没有加入集群就是standalone,加入集群式follower或者leader




三 编写Zabbix监控ZooKeeper的脚本和配置文件



四 制作Zabbix监控ZooKeeper的模板并设置报警阀值














参考文档:

https://blog.serverdensity.com/how-to-monitor-zookeeper/







本文出自 “Linux SA John” 博客,请务必保留此出处http://john88wang.blog.51cto.com/2165294/1745339

以上是关于使用Zabbix监控ZooKeeper服务的健康状态的主要内容,如果未能解决你的问题,请参考以下文章

Zabbix监控Tengine 后端服务器健康检查

zabbix自动发现监控tomcat健康页面

zabbix系列zabbix3.4监控zookeeper3.4.10

ZABBIX结合自动发现机制实现站点/hs页面健康监控

ZABBIX结合自动发现机制实现站点/hs页面健康监控

zabbix 3.4监控zookeeper3.4