k8s实战kubernetes错误排查之etcd篇
Posted Friends of the wind
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了k8s实战kubernetes错误排查之etcd篇相关的知识,希望对你有一定的参考价值。
学习目标
提示:无论是实验环境,还是生产,k8s集群环境不一样,所以思维逻辑是一样但命令需要适时地调整
通过本节的学习,您将获得处理k8s集群问题的通用方法,针对etcd方面问题具体,如何快速排查处理。
知识充电:什么是etcd ?
它是一个简单的数据库,k8s默认使用它存储集群的配置信息。
为什么不选择mysql等其他更好的数据库服务?
因为etcd有四大特点:
简单:安装配置简单,而且提供了HTTP API进行交互,使用也很简单
安全:支持SSL证书验证
快速:根据官方提供的benchmark数据,单实例支持每秒2k+读操作
可靠:采用raft算法,实现分布式系统数据的可用性和一致性
内容
背景:其他部门反馈,k8s集群的前端web管理页面无法对k8s集群进行增删查的操作,并会有报错提示,显示请求数过多。
一、k8s集群问题处理流程:
1.从已知信息获取更多有助解决问题的信息
根据报错提示信息估计,是计算资源不足以支撑处理请求的能力;反馈,出故障前后,有没有执行过什么操作,创建pod及在集群安装服务等等。
2.登录集群节点命令获取更多有助解决问题的信息
- 查看集群ma
以上是关于k8s实战kubernetes错误排查之etcd篇的主要内容,如果未能解决你的问题,请参考以下文章
云原生之kubernetes实战kubernetes集群的证书管理