k8s集群问题记录
Posted lishikai
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了k8s集群问题记录相关的知识,希望对你有一定的参考价值。
k8s集群问题记录
主要学习路径:
rancher(k8s)->rke->helm->kubectl->k8s(k8s中文api)
常见问题总结:
-
怎么解决简单就怎么解决例如
rancher的安装使用helm安装有问题,官网有bug就使用docker的方式安装一样简便,只是个客户端没必要死扣
-
对于由于环境问题引起的问题的 排查
./rke up 启动过程中提示有备份,这时候思路应该是路径或者环境变量中有残留文件导致失败
-
大框架学习思路
从周边应用入手由应用带动学习内部构件。例如本次学习k8s,先起手一键式环境安装工具rancher,而后因为部署节点问题进一步研究一键式部署环境rke部署k8s,再进一步进行部署集群中的应用遇到问题学习helm,在进一步进行与部署应用进行交互和排查故障学习kubectl,进而了解和学习k8s全貌。现研究大框架使用带来的问题解决方案,再以此细化研究采用逐层的方式一步步深入。达到对k8s整个样貌的学习。
思考:
采用绘图工具进行抽象交互绘制,职能图绘制
采用时序图进行功能单元交互绘制
细节问题
-
kubectl 连接交互rke生成k8s问题
使用rke构建k8s集群会生成用于kubectl交互k8s的配置文件xxx-cluster-xxxconfig.yaml,通过kubectl通过此配置文件连接到k8s集群中进行日常排查工作。
x509: certificate signed by unknown authority (possibly because of "crypto/rsa while trying to verify candidate authority certificate "kube-ca
-
证书签名问题
当./rke up启动的时候会创建 /etc/kubernetes 目录,如果已经有此目录就不会重新覆盖,里边包含了ssl 文件就不会更新成最新的导致etc 老是检查失败从而导致错误的发生。删除此目录,运行./rke up让这个目录重新生成就可以保证没有问题了。
Error from server (AlreadyExists): clusterrolebindings.rbac.authorization.k8s.io "cluster-admin-binding" already exists
3.进行集群导入到rancher的时候残留配置文件导致导入失败
sudo kubectl get clusterrolebindings cluster-admin-binding -o yaml
apiVersion: rbac.authorization.k8s.io/v1 kind: ClusterRoleBinding
metadata: creationTimestamp: "2020-02-10T13:35:42Z" name:
cluster-admin-binding resourceVersion: "35967" selfLink:
/apis/rbac.authorization.k8s.io/v1/clusterrolebindings/cluster-admin-binding
uid: d3c207d2-4adc-4e3e-951d-48c5ad99eeaa roleRef: apiGroup:
rbac.authorization.k8s.io kind: ClusterRole name: cluster-admin
subjects:
- apiGroup: rbac.authorization.k8s.io kind: User name: lishikai
sudo kubectl delete clusterrolebindings cluster-admin-binding
clusterrolebinding.rbac.authorization.k8s.io "cluster-admin-binding"
deleted
重新进行集群导入
常用命令学习以及使用
以上是关于k8s集群问题记录的主要内容,如果未能解决你的问题,请参考以下文章