监控运维日志

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了监控运维日志相关的知识,希望对你有一定的参考价值。

监控体系

技术图片

grafana界面显示无数据展示

技术图片

排错流程:

1、找到表盘所显示的数据源
2、登陆到数据源所在机器,查看数据库是否在运行
2.1、未运行,则运行数据库
2.2、运行中,则登陆数据库
2.2.1、influxdb直接在系统中influx登陆,
2.2.2、prometheus直接登陆主机IP:9090
3、查看无数据显示的数据库中有无数据
3.1、库中有数据,检查数据源与grafana之间连接
3.2、库中无数据,检查数据源与采集软件(脚本)之间连接
4、查看采集组件(node_exporter或采集脚本)是否运行
4.1、未运行,则运行采集组件
4.2、运行中,检查采集组件是否存在问题

发现现状:

1、influxdb库中数据到昨天下午截止
2、手动运行采集脚本(通过curl的-X POST方式上传)
技术图片

报错:influxdb-error:max-values-per-tag limit 100000
influxdb官网对于这条配置的解释:
https://docs.influxdata.com/enterprise_influxdb/v1.7/administration/config-data-nodes/#max-values-per-tag-100000

处理方法1:清除旧数据

influx

use DATABASES;
show measurements 查看表
drop measurement TABLES;

处理方法2:修改influxdb配置,将max-values-per-tag的值改为0,意思是不限制数据条数

配置文件:influxdb.conf
技术图片

以上是关于监控运维日志的主要内容,如果未能解决你的问题,请参考以下文章

运维开发实践——基于Sentry搭建错误日志监控系统

运维篇-zabbix监控基础

监控运维日志

Linux运维之监控CPU和内存的日志工具

Greenplum 监控与运维

Greenplum 监控与运维