k8s实战kubernetes错误排查之etcd篇

Posted Friends of the wind

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了k8s实战kubernetes错误排查之etcd篇相关的知识,希望对你有一定的参考价值。

学习目标

提示:无论是实验环境,还是生产,k8s集群环境不一样,所以思维逻辑是一样但命令需要适时地调整

通过本节的学习,您将获得处理k8s集群问题的通用方法,针对etcd方面问题具体,如何快速排查处理。

知识充电:什么是etcd ?

它是一个简单的数据库,k8s默认使用它存储集群的配置信息。

为什么不选择mysql等其他更好的数据库服务?

因为etcd有四大特点:

简单:安装配置简单,而且提供了HTTP API进行交互,使用也很简单
安全:支持SSL证书验证
快速:根据官方提供的benchmark数据,单实例支持每秒2k+读操作
可靠:采用raft算法,实现分布式系统数据的可用性和一致性


内容

背景:其他部门反馈,k8s集群的前端web管理页面无法对k8s集群进行增删查的操作,并会有报错提示,显示请求数过多。

一、k8s集群问题处理流程:

1.从已知信息获取更多有助解决问题的信息
根据报错提示信息估计,是计算资源不足以支撑处理请求的能力;反馈,出故障前后,有没有执行过什么操作,创建pod及在集群安装服务等等。

2.登录集群节点命令获取更多有助解决问题的信息

  • 查看集群ma

以上是关于k8s实战kubernetes错误排查之etcd篇的主要内容,如果未能解决你的问题,请参考以下文章

k8s篇备份之velero

云原生之kubernetes实战kubernetes集群的证书管理

k8s 入门系列之集群安装篇

k8s入门系列之集群安装篇

【k8s】kubernetes实战篇之创建密钥自动拉取私服镜像

云原生之kubernetes实战使用yum方式部署kubernetes集群