Zabbix监控Elastalert

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Zabbix监控Elastalert相关的知识,希望对你有一定的参考价值。

Zabbix监控Elastalert

前言

现平台已大量使用Elastalert作为ELK日志告警器,上周出现某个index告警查询异常;导致无法正常告警,在还没计划好构建高可用方案前,先确保能够第一时间知道Elastalert状态是否正常。

方案

Elastalert配置文件中writeback_index回写的index,查询同时,向ES的index记录状态,会生成index_silence index_error index_status

  • index_error记录错误信息.
  • index_status记录状态信息.

在查看状态信息记录的时候,发现与Elastalert告警查询异常时间吻合,所以我们只需要用Zabbix监控该index就OK.

实施

查询十五分钟内的数据,生成自发现字典格式

由于我的rulename都是由字符与空格组成,所以替换成``号.

get_rules(){
    get_scroll=$(curl -s -XPOST "${ES_HOST}:${ES_PORT}/${INDEX}/_search?size=1000&_source=rule_name"         -H ‘Content-Type: application/json‘ -d ‘
{
    "query" : {
        "match_all" : {}
    }
}‘)
    result=$(echo $get_scroll |grep -oP "(?<=rule_name":)"[^"]*""|sort|uniq|sed ‘s/"//g‘|sed ‘s/ /_/g‘|tr ‘
‘ ‘|‘)  
    data=(${result//|/ })
    length=${#data[@]}
    printf "{
"
    printf  ‘	‘""data":["
    for ((i=0;i<$length;i++))
    do
        item=${data[$i]}
        printf ‘
		{‘
        printf ""{#RULE_NAME}":"${item}"}"
        if [ $i -lt $[$length-1] ];then
            printf ‘,‘
        fi
    done
    printf  "
	]
"
    printf "}
"
    exit 0 
}

查询某个index的状态

get_status(){
    local rule=${1//_/ }
    query=$(cat << EOF
{
  "query" : {
    "bool": {
      "must": [
        {"match" : {"rule_name": "${rule}"}},
        {"range" : {"@timestamp":{"gte":"now-15m"}}}
      ]
    }
   }
} 
EOF
)
    get_data=$(curl -s -XPOST  "${ES_HOST}:${ES_PORT}/${INDEX}/_search?size=1"         -H ‘Content-Type: application/json‘ -d "${query}")
    result=$(echo $get_data |grep -oP "(?<=rule_name":)"[^"]*"")
    echo "${rule}" |grep -qw "${result//"/}" && echo 0 || echo 1
    exit 0
}

后记

脚本传送门

以上是关于Zabbix监控Elastalert的主要内容,如果未能解决你的问题,请参考以下文章

Zabbix中小型企业Zabbix监控实战之告警大全

基于ELK 7.50搭建elastalert 监控报警和权限控制

elastalert docker安装

ELK借助ElastAlert实现故障提前感知预警功能

基于Zabbix实现监控Jenkins过程详解

zabbix使用zabbix_java_gateway 监控java应用进程