Kubelet 证书⾃动续期解决⽅案

Posted flyfish225

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Kubelet 证书⾃动续期解决⽅案相关的知识,希望对你有一定的参考价值。

Kubelet 证书⾃动续期解决⽅案

标签(空格分隔):kubernetes系列


[toc]


一:关于kubelet 证书的问题

1.1 k8s 证书问题

在⼀个 K8s 集群中,node 节点上的组件( kubelet 和 kube-proxy )需要与 master 节点(尤其是 kube- apiserver)进⾏通信时,为了确保通信本身的私密性和通信过程不被⼲扰,K8s 会使⽤ TLS 加密通信。只要是证书,就会有到期时间,⽽到期了就需要续签,否则就⽆法正常通信,因此⼀旦启⽤了 TLS 认证 ,就会不得不时刻去关⼼证书到期的问题。
⾃ 1.4 版本后,K8s 推出了   功能,以此证书签名和请求都可以通过 K8s 提供的 API 的⽅式
进⾏,这很⼤程度上节省了证书⽣成签名⼯作。当然随着   的推出,对于集群证书的管理来说就更加简单
了,⼏条命令即可完成证书⽣命周期的管理。但是对于⼆进制包安装集群的场景来说,这个过程还是⽐较痛苦的。
⼀般来说,我们会在⽣成 etcd 和 K8s 集群 ca 证书时,将证书有效期声明的较⻓(5~10年),但是在通过
apiserver CA 签发的 kubelet 证书时,会遵循默认的证书有效期 —— 8760h (即 1年)。

如果证书过期了,就会在⽇志中出现 certificate has expired or is not yet valid

的错误信息,node 节点将不能与  master  节点进⾏通信,这将对业务环境造成极⼤的灾难,于是乎我们就不得不时时刻刻去关注着证书什么时候,以便于更早的可以对其进⾏替换。
当需要管理的节点原来越多的时候,替换证书就会是⼀件⾮常繁琐的事情,我们当然会更加期望能以⼀种更加⽅便     的⽅式去实现这⼀过程,因此也就引出了我们本⽂的话题 —— 如何去实现 Kubelet 证书的⾃动续签。

1.2 TLS bootstrapping 证书⾃动续期⽅案实施

事实上,⾃ Kubernetes 1.8 版本开始就包含了⼀个 beta 特性 —— kubelet certificate rotation,在当前的证书有
效期到达总有效期的 70% ~ 90% 时,kubelet 便会发起⼀个    的 CSR 请求从 apiserver 重新申请证书,新
证书可⽤后   就会⾃动批准续签。

注意:
     K8s 版本为 1.8 或更⾼时,kubelet certificate relation 会⾃动加载新证书,⽆需⼿动重启服务;K8s 版本低于 1.8 则需要⼿动重启服务才能加载新证书

1.3 配置 kubelet client/server 证书轮换

1)kube-controller-manager 配置参数

  所有 master 节点都需要操作。

修改配置文件:kube-controller-manager.conf

⽂件路径: kubernetes/cfg/kube-controller-manager.conf ,完整配置⽂件内容如下:
    KUBE_CONTROLLER_MANAGER_OPTS="--logtostderr=false \\
--v=2 \\
--log-dir=/data/application/kubernetes/logs \\
--leader-elect=true \\
--master=127.0.0.1:8080 \\
--bind-address=127.0.0.1 \\
--allocate-node-cidrs=true \\
--cluster-cidr=10.244.0.0/16 \\
--service-cluster-ip-range=10.0.0.0/16 \\
--cluster-signing-cert-file=/data/application/kubernetes/ssl/ca.pem \\
--cluster-signing-key-file=/data/application/kubernetes/ssl/ca-key.pem  \\
--root-ca-file=/data/application/kubernetes/ssl/ca.pem \\
--service-account-private-key-file=/data/application/kubernetes/ssl/ca-key.pem \\
--experimental-cluster-signing-duration=87600h0m0s \\
--feature-gates=RotateKubeletServerCertificate=true"


1.4 k8s 1.11 之前的版本

2)kubelet 配置参数
1.K8s 1.11 版本及以前(了解即可)  注意:
K8s 1.11 版本之前,RotateKubeletServerCertificate 默认是关闭的功能,需要在 kubelet 和 kube- controller-manager 中⼿动开启

修改配置⽂件: kubelet.conf
     注意: 所有 node 节点都需要进⾏操作(包括作为 node 加⼊集群的 master 节点)。

 vim kubernetes/cfg/kubelet.conf
-----
KUBELET_OPTS="--logtostderr=false \\
--v=2 \\
--log-dir=/data/application/kubernetes/logs \\
--hostname-override=t-k8sN-001 \\
--network-plugin=cni \\
--kubeconfig=/data/application/kubernetes/cfg/kubelet.kubeconfig \\
--bootstrap-kubeconfig=/data/application/kubernetes/cfg/bootstrap.kubeconfig \\
--config=/data/application/kubernetes/cfg/kubelet-config.yml \\
--cert-dir=/data/application/kubernetes/ssl \\
--pod-infra-container-image=lizhenliang/pause-amd64:3.0 \\
--node-labels=node.kubernetes.io/k8s-node=true \\
--feature-gates=RotateKubeletClientCertificate=true,RotateKubeletServerCertificate=true --rotate-certificates"
-----

1.5 k8s 1.11 之后的版本

新增参数说明

修改配置⽂件
 注意: 所有 node 节点都需要进⾏操作(包括作为 node 加⼊集群的 master 节点),以下两种⽅法选⼀种即可,推荐 yaml 声明
⽂件路径: kubernetes/cfg/kubelet-config.yml ,追加内容如下:

vim /opt/kubernetes/cfg/kubelet-config.yml
----
featureGates:
RotateKubeletServerCertificate: true 
rotateCertificates: true 
serverTLSBootstrap: true
----

文件路径: kubernetes/cfg/kubelet.conf (不推荐,后期版本逐步废弃),⽂件内容如下:

KUBELET_OPTS="--logtostderr=false \\
--v=2 \\
--log-dir=/data/application/kubernetes/logs \\
--hostname-override=t-k8sN-001 \\
--network-plugin=cni \\
--kubeconfig=/data/application/kubernetes/cfg/kubelet.kubeconfig \\
--bootstrap-kubeconfig=/data/application/kubernetes/cfg/bootstrap.kubeconfig \\
--cert-dir=/data/application/kubernetes/ssl \\
--config=/data/application/kubernetes/cfg/kubelet-config.yml \\
--pod-infra-container-image=lizhenliang/pause-amd64:3.0 \\
--node-labels=node.kubernetes.io/k8s-node=true \\
--feature-gates=RotateKubeletServerCertificate=true \\
--rotate-certificates \\
--rotate-server-certificates"

1.6 创建 RBAC 规则

我们知道 kube-apiserver 会从 kubelet 处收到 CSR 请求,并对这些请求进⾏身份认证,但实际上真正负责签发证书的是 kube-controller-manager ,同时 controller-manager 还控制着证书的有效期。因此,想要实现⾃动续签证书,除了自动生成证书发起请求外,还得让  controller-manager  能够⾃动地批复接受到的  CSR  请求。当然,总不能什么 CSR 请求都批发,既然我们是要实现 kubelet证书的自动续签,就必须告知 controller-manager 只对 kubelet 发起的特定 CSR 请求进⾏批复。这需要通过 RBAC规则中的clusterole 来实现。
ClusterRole 实际上只是用于定义⼀种集群范围内的能力,这种能力需要我们通过声明资源来创建。对于自动批复
CSR,k8s 提供了以下3种 API 方法:
nodeclient: ⾃动批复    组⽤户(默认值,具体根据实际的 token.csv 为准)
⾸次申请证书的 CSR 请求(新节点,还没有证书)

selfnodeclient: 自动批复 system:nodes 组⽤户更新 kubelet ⾃身与 apiserver 通讯⽤证书的 CSR 请求 ( kubelet-client-xxxx.pem )

selfnodeserver: 自动批复求system:nodes 组⽤户更新 kubelet 10250 端口API 鉴权⽤证书的 CSR 请求( kubelet.crt)

1.7 K8s 1.8 版本前 (了解即可)

创建 clusterole

vim approve-renewal-csr.yaml
-----

# A ClusterRole which instructs the CSR approver to approve a user requesting # node client credentials.
kind: ClusterRole
apiVersion: rbac.authorization.k8s.io/v1 metadata:
name: approve-node-client-csr rules:
- apiGroups: ["certificates.k8s.io"]
resources: ["certificatesigningrequests/nodeclient"] verbs: ["create"]
---
# A ClusterRole which instructs the CSR approver to approve a node renewing its # own client credentials.
kind: ClusterRole
apiVersion: rbac.authorization.k8s.io/v1 metadata:
name: approve-node-client-renewal-csr rules:
- apiGroups: ["certificates.k8s.io"]
resources: ["certificatesigningrequests/selfnodeclient"] verbs: ["create"]
---
# A ClusterRole which instructs the CSR approver to approve a node requesting a # serving cert matching its client cert.
kind: ClusterRole
apiVersion: rbac.authorization.k8s.io/v1 metadata:
name: approve-node-server-renewal-csr rules:
- apiGroups: ["certificates.k8s.io"]
resources: ["certificatesigningrequests/selfnodeserver"] verbs: ["create"]

----
创建资源:
  kubectl apply -f approve-renewal-csr.yaml

创建:ClusterRoleBinding 自动批准首次申请证书
还没有证书,所以是组system:node-bootsrapper 组
kubectl create clusterrolebinding node-client-auto-approve-csr --clusterrole=approve- node-client-csr --group=system:node-bootstrapper

自动批准更新 kubelet 自身与 apiserver 通讯用证书

已有证书,所以是组system:nodes组

kubectl create clusterrolebinding node-client-auto-renew-crt --clusterrole=approve- node-client-renewal-csr --group=system:nodes

自动批准更新 kubelet 10250 端口 API鉴权⽤证书
已有证书,所以是system:nodes组

kubectl create clusterrolebinding node-server-auto-renew-crt --clusterrole=approve- node-server-renewal-csr --group=system:nodes

如上创建后可以通过 kubectl get clusterrolebinding|egrep "node-(.*)-auto" 进⾏查看,结果如下:


1.8 k8s 1.8 之后的版本

我们上⾯说到,K8s 提供了三种 ClusterRole 来进⾏ CSR 的自动批复⼯作。在 K8s 1.8 版本前都需要手动创

建,而从 1.8 版本起 kube-apiserver 会自动创建nodeclient
和 selfnodeclient ,所以我们只需要再⼿
动创建selfnodeserver就可以了。

创建clusteRole 
vim auto-approve-csr-clusterrole.yml

# A ClusterRole which instructs the CSR approver to approve a node requesting # a serving cert matching its client cert.
kind: ClusterRole
apiVersion: rbac.authorization.k8s.io/v1 
metadata:
  name: system:certificates.k8s.io:certificatesigningrequests:selfnodeserver 
rules:
 - apiGroups: ["certificates.k8s.io"]
   resources: ["certificatesigningrequests/selfnodeserver"] 
   verbs: ["create"]

创建ClusterRoleBinding
vim auto-approve-csr-clusterrolebinding.yaml
# 批复 "system:node-bootstrapper" 组的所有 CSR 
apiVersion: rbac.authorization.k8s.io/v1 
kind: ClusterRoleBinding
metadata:
  name: node-client-auto-approve-csr 
subjects:
- kind: Group
  name: system:node-bootstrapper 
  apiGroup: rbac.authorization.k8s.io
roleRef:
  kind: ClusterRole
  name: system:certificates.k8s.io:certificatesigningrequests:nodeclient 
  apiGroup: rbac.authorization.k8s.io
---
# 批复 "system:nodes" 组 kubelet 与 apiserver 通信证书续约请求
apiVersion: rbac.authorization.k8s.io/v1 
kind: ClusterRoleBinding
metadata:
  name: node-client-auto-renew-crt 
subjects:
- kind: Group
  name: system:nodes
  apiGroup: rbac.authorization.k8s.io 
roleRef:
  kind: ClusterRole
  name: system:certificates.k8s.io:certificatesigningrequests:selfnodeclient 
  apiGroup: rbac.authorization.k8s.io
---
# 批复 "system:nodes" 组 kubelet 10250端⼝ API 鉴权证书续约请求
apiVersion: rbac.authorization.k8s.io/v1 
kind: ClusterRoleBinding
metadata:
  name: node-server-auto-renew-crt 
subjects:
  - kind: Group
    name: system:nodes
    apiGroup: rbac.authorization.k8s.io 
roleRef:
  kind: ClusterRole
  name: system:certificates.k8s.io:certificatesigningrequests:selfnodeserver 
  apiGroup: rbac.authorization.k8s.io

kubectl get clusterrolebinding|egrep "node-(.*)-auto"

二: 重启服务与删除证书

2.1 重启kube-controller-manger

重启kube-controller-manager 如果有多个master 就逐个重启

systemctl daemon-reload
systemctl restart kube-controller-manager.service

2.2 删掉kubelet的证书

查看默认证书时间
openssl x509 -in kubelet-client-current.pem -noout -text | grep "Not"

rm -rf /opt/kubernetes/ssl/kubelet*  [所有节点的证书]

重新启动 节点kubelet 

service kubelet restart 

查看原 kubelet server 证书的有效期 
  会少了两个文件: kubelet.crt , kubelet.key 文件
  默认情况下签发的 kubelet server 证书的有效期只有 1 年,并不受 kube-controller-manager 控制其证书有效期。

2.3 重新签发证书

重新签发证书:
kubectl get csr

kubectl get csr|grep "Pending"|awk \'NR>1{print $1}\'|xargs kubectl certificate approve

 kubectl certificate approve csr-f7jl6

证书管理:
   openssl x509 -in /opt/kubernetes/ssl/kubelet-client-current.pem -noout -text| grep Not

以上是关于Kubelet 证书⾃动续期解决⽅案的主要内容,如果未能解决你的问题,请参考以下文章

java后端实现token自动续期,这方案有点优雅

java后端实现token自动续期,这方案有点优雅

SSL证书的申请自动续期与常见问题

SSL证书的申请自动续期与常见问题

kubelet签署证书到期解决

脚本自动续期ssl证书 Let’s Encrypt