Zabbix“专家坐诊”第82期问答汇总
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Zabbix“专家坐诊”第82期问答汇总相关的知识,希望对你有一定的参考价值。
Q:我所有的监控项都是通过自动发现获取的item和值,这个数据获取的时间是怎么控制的,现在感觉都是无序的,我想控制在每个整点的10分左右更新数据。
A:zabbix获取数据是轮询的。有时候数据会出现采集超时的情况,时间上并不是很好控制。建议是从zabbix自身、数据库等方面进行优化,减小采集item的耗时,这样数据获取的时间基本都不会有大的差距。
Q:那应该要怎么优化的能提供下思路吗,不知道改怎么优化
A:zabbix自身的优化,可以从自身的进程方面,比如poller过于繁忙,那么适当加大进程;数据库则是做表分区、存储过程;在硬件这块可以上ssd等。 在网上有很多zabbix优化的资料,你可以查下看看。
Q:好的,这个LLD获取数据的时间,是根据主机启动的时间开始获取的吗?
A:从启用监控的那个时间开始去获取数据。
Q:请问下,如果部署时候软件版本是5.0;新版本5.0.5;也升级到5.0.5、但是已有的Template还是5.0的,针对5.0 - 5.0.5中间这些版本新增修复的Template如何进行升级呢?有办法进行Template的更新吗?
A:部署一台5.0.5的,然后对比下template,有差别对比后再决定是否要导入更新上。 如果目前监控是满足需求的,也可以不做模板的升级。
Q:最近监控trap告警,有几个疑惑请帮忙:
在trap中,示 SNMPv2-SMI::enterprises.2file:///C:UsersadminAppDataRoamingTencentQQTempSys\%W@GJ$ACOF(TYDYECOKVDYB.png011.2.235.1.1.500.10.13.114,而不是HUAWEI-SERVER-IBMC-MIB::hwRAIDRebuildDeassert, 把HUAWEI-SERVER-iBMC-MIB.mib文件放到mibdir目录了,如下图:
A:你最后要达到的目的是什么呢?
Q:看网上别人配置后显示是这样的,比数字好理解:
看着数字不明白是什么意思,还需要对照文档才能理解每个参数
A:能发下你这边的配置步骤/参考网址看下不?html
br/>Q:参考网址:file:///C:UsersadminAppDataRoamingTencentQQTempSys\%W@GJ$ACOF(TYDYECOKVDYB.pnghttps://www.cnblogs.com/lwops/p/10148392.html
我在/etc/snmp/snmp.conf中添加总提示语法不对,然后参考其他文章在/etc/profile中引入了:
export MIBS=ALL
Q:请教一个问题,zabbix保存到数据库的数据有哪些呢?我想取一些主机的性能数据,cpu 内存这些
A: zabbix保存历史数据的表是history、history_log、history_str、history_text、history_uint,一般像cpu内存这些浮点/整数的数据,可以看下history跟history_uint
Q:我用api获取类似没分钟的cpu负载,取平均值作为每小时的cpu平均负载,这个做法可行么?
A:可以的
Q:OK
Q:还有一个问题,一条trap告警信息有重复发送的情况,也就是隔一段时间又发送一次,为避免这总情况,我创建了一个fallback,给每种trap错误创建了一个触发器, {Huawei_PCServer_2288Hv5:snmptrap.fallback.str(SNMPv2-SMI::enterprises.2file:///C:UsersadminAppDataRoamingTencentQQTempSys\%W@GJ$ACOF(TYDYECOKVDYB.png011.2.235.1.1.500.10.13.113)}=1 跟 {Huawei_PCServer_2288Hv5:snmptrap.fallback.str(SNMPv2-SMI::enterprises.2file:///C:UsersadminAppDataRoamingTencentQQTempSys\%W@GJ$ACOF(TYDYECOKVDYB.png011.2.235.1.1.500.10.13.1)}=1同时存在的情况下,后一个被触发,前一个永远无法触发。
我想问一下,trap告警这样处理合适吗? 表达式如何写才能避免这种情况A:2file:///C:UsersadminAppDataRoamingTencentQQTempSys\%W@GJ$ACOF(TYDYECOKVDYB.png011.2.235.1.1.500.10.13.113是 RAID rebuild detected,2file:///C:UsersadminAppDataRoamingTencentQQTempSys\%W@GJ$ACOF(TYDYECOKVDYB.png011.2.235.1.1.500.10.13.1是Storage device presence detected。
我刚模拟了下,你这边做依赖是可以实现的。个人是觉得根据不同trap OID 分多个成监控项会比较方便。
Q:谢谢,我试试依赖,分多个监控项也有同样的问题,就是1 和113会先匹配1
Q:大神也帮我看看呀,为什么显示问题呢?
A:你这里监控项返回的值不等于0,就触发了告警了
以上是关于Zabbix“专家坐诊”第82期问答汇总的主要内容,如果未能解决你的问题,请参考以下文章