21有状态应用编排StatefulSet

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了21有状态应用编排StatefulSet相关的知识,希望对你有一定的参考价值。

有状态应用编排statefulset
statefulset:
有状态应用:前后请求之间存在一定的相关性的应用
如:mysql数据库类别的应用、需要跟踪用户setion的应用

statefulset与Deployment重大不同之处在于:
Deployment所编排下的每一个应用是无状态,互相可以取代,因此连应用的名字都是随机的
statefulset需要明确区分编排下的每个实例,每个实例不能互相取代。
如mysql中的实例,一个master,一个slave,slave取代master需要复杂的步骤才可以做到,让master降级为slave也是如次,因在在这种情况下,需要对每一个实例明确标明身份,所以要明确区别编排下的每个实例

如何区别编排下的每个实例:
基于索引编号的逻辑追踪每个pod

为了能够基于索引编号的逻辑追踪每个pod,
第一步:每个statefulset资源都需要强依赖于一个headless service:
headless service会将service name直接解析为一个pod ip;
pod ip能基于GTR的方式反解析为 pod name(pod的唯一标识)

第二步:业务需求顺序管理对象
实例间的管理:存在顺次关系
(如mysql主从,先创建主,后创建从。或者是扩容,应对从进扩容。终止应用,先删除从,后删除主)
创建:索引号由小到大
删除和缩容:索引号由大到小

statefulset与Deployment存储的不同:
Deployment:
Pod Template:
volumes:
- name: mydata
persistentVolumeClaim:
claimName: mysqldata
定义在一个Pod Template中的卷,基于该实例化出来的所有Pod将共享该卷;对于有状态应用来说,是噩梦般的存在。如:redis cluster中的各redis实例一定是持有不同数据集的,它们各自实例化数据的时候都放在同一个pod模板所实例化出来的PVC上,而且使用同样的文件名来持久存数据,很可能会导致互相覆盖,所以在statefulset的pod模板当中一定不能使用volumes来定义卷。

有状态应用数据持久性解决办法:使用卷请求模板:Volume Claim Template:为每个Pod实例生成一个专用的卷;
使用卷请求模板,需要关联到每一个pod至上都是PVC卷,这些PVC的卷,通常从某一个StorageClass中来请求分配得到。应用的规模不等,很可能随时扩缩容,那我们提前制备好PV的可能性几乎是不存在的,基于这种假设,我们的PV卷请求所关联的存储类应该支持PV的动态制备功能,才是更理想的。


示例如下:
---
apiVersion: v1
kind: Service
metadata:
name: demoapp-sts
namespace: default
spec:
clusterIP: None #定义成headless service
ports:
- port: 80
name: http
selector:
app: demoapp
controller: sts-demo
---
apiVersion: apps/v1
kind: StatefulSet
metadata:
name: sts-demo
spec:
serviceName: demoapp-sts #StatefulSet必选字段,要引用的无头服务的名字叫什么
replicas: 2
selector:
matchLabels:
app: demoapp
controller: sts-demo
template:
metadata:
labels:
app: demoapp
controller: sts-demo
spec:
containers:
- name: demoapp
image: ikubernetes/demoapp:v1.0
ports:
- containerPort: 80
name: web
volumeMounts:
- name: appdata
mountPath: /app/data
volumeClaimTemplates: #卷请求模板定义
- metadata:
name: appdata #卷名
spec:
accessModes: [ "ReadWriteOnce" ] #基于模板请求生成PVC时的访问模式,只供一个pod专用
storageClassName: "nfs-csi" #关联的存储类
resources:
requests:
storage: 2Gi

示例2:简单的数据库形应用
cat demodb.yaml
---
apiVersion: v1
kind: Service
metadata:
name: demodb
namespace: default
labels:
app: demodb
spec:
clusterIP: None
ports:
- port: 9907
selector:
app: demodb
---
apiVersion: apps/v1
kind: StatefulSet
metadata:
name: demodb
namespace: default
spec:
selector:
matchLabels:
app: demodb
serviceName: "demodb"
replicas: 2
template:
metadata:
labels:
app: demodb
spec:
containers:
- name: demodb-shard
image: ikubernetes/demodb:v0.1
ports:
- containerPort: 9907
name: db
env:
- name: DEMODB_DATADIR
value: "/demodb/data"
livenessProbe:
initialDelaySeconds: 2
periodSeconds: 10
httpGet:
path: /status
port: db
readinessProbe:
initialDelaySeconds: 15
periodSeconds: 30
httpGet:
path: /status?level=full
port: db
volumeMounts:
- name: data
mountPath: /demodb/data
volumeClaimTemplates:
- metadata:
name: data
spec:
accessModes: [ "ReadWriteOnce" ]
storageClassName: "nfs-csi"
resources:
requests:
storage: 2Gi
updateStrategy:
type: RollingUpdate
maxUnavailable: 1
partition: 3
部署nfs参考文档:https://github.com/iKubernetes/learning-k8s/blob/master/csi-driver-nfs/README.md

部署nfs
第一步:部署nfs-server
创建名称空间
[root@K8s-master01 ~]#kubectl create namespace nfs
namespace/nfs created
查看名称空间
[root@K8s-master01 ~]#kubectl get ns
NAME STATUS AGE
default Active 6d4h
nfs Active 40s

在nfs名称空间下部署nfs-server (需要访问到github)
[root@K8s-master01 ~]#kubectl apply -f https://raw.githubusercontent.com/kubernetes-csi/csi-driver-nfs/master/deploy/example/nfs-provisioner/nfs-server.yaml --namespace nfs
service/nfs-server created #创建了一个svc
deployment.apps/nfs-server created #创建了一个工作负载型控制器
验证
[root@K8s-master01 ~]#kubectl get pods -n nfs
NAME READY STATUS RESTARTS AGE
nfs-server-5847b99d99-9spwf 1/1 Running 0 96s

[root@K8s-master01 ~]#kubectl get svc -n nfs


第二步:安装nfs-csi-driver(Install NFS CSI driver v3.1.0 version on a kubernetes cluster)
[root@K8s-master01 ~]#curl -skSL https://raw.githubusercontent.com/kubernetes-csi/csi-driver-nfs/v3.1.0/deploy/install-driver.sh | bash -s v3.1.0 --
Installing NFS CSI driver, version: v3.1.0 ...
serviceaccount/csi-nfs-controller-sa created
clusterrole.rbac.authorization.k8s.io/nfs-external-provisioner-role created
clusterrolebinding.rbac.authorization.k8s.io/nfs-csi-provisioner-binding created
csidriver.storage.k8s.io/nfs.csi.k8s.io created
deployment.apps/csi-nfs-controller created
daemonset.apps/csi-nfs-node created
NFS CSI driver installed successfully.
验证pod状态
[root@K8s-master01 ~]#kubectl get pods -n kube-system
NAME READY STATUS RESTARTS AGE
csi-nfs-controller-65cf7d587-5sxvg 3/3 Running 0 7m32s
csi-nfs-controller-65cf7d587-z9nn5 3/3 Running 0 7m32s
csi-nfs-node-8xw66 3/3 Running 0 7m27s
csi-nfs-node-lrkd9 3/3 Running 0 7m27s
csi-nfs-node-nk8k2 3/3 Running 0 7m27s
csi-nfs-node-rnc4b 3/3 Running 2 (10s ago) 7m27s
csi-nfs-node-vr5xd 3/3 Running 0 7m27s
csi-nfs-node-wkxzh 3/3 Running 0 7m27s

第三步:创建storageclass,配置CSI Driver引用前面部署的nfs server为存储后端
[root@K8s-master01 manifeste]#cat storageclass-nfs.yaml
---
apiVersion: storage.k8s.io/v1
kind: StorageClass
metadata:
name: nfs-csi #存储类名称
provisioner: nfs.csi.k8s.io #插件名称
parameters:
#server: nfs-server.default.svc.cluster.local #通过这个名称来引用
server: nfs-server.nfs.svc.cluster.local
share: /
#reclaimPolicy: Delete
reclaimPolicy: Retain #回收策略
volumeBindingMode: Immediate #绑定策略
mountOptions:
- hard
- nfsvers=4.1

创建并查看
[root@K8s-master01 manifeste]#kubectl apply -f storageclass-nfs.yaml
storageclass.storage.k8s.io/nfs-csi created

storageclass是集群下的资源
[root@K8s-master01 manifeste]#kubectl get sc
NAME PROVISIONER RECLAIMPOLICY VOLUMEBINDINGMODE ALLOWVOLUMEEXPANSION AGE
nfs-csi nfs.csi.k8s.io Retain Immediate false 41s

创建数据库应用并查看
[root@K8s-master01 manifeste]#kubectl apply -f demodb.yaml
[root@K8s-master01 manifeste]#kubectl get pods
会顺序创建pod

使用kubectl explain statefulset.spec内部有个字段
podManagementPolicy:pod资源管理策略
默认取值:OrderdRead,会pod-0、pod-1依次类推来处理pod
扩容的时候自索引小到索引大,缩容的时候自索引大到索引小来进行
其他取值:Parallel,在处理pod时会并行处理

彼此间不存在顺序关系的时候,定义成Parallel,能有效地提升应用的扩缩容及部署时的性能


statefulset的更新策略:
使用kubectl explain statefulset.spec内部有个字段
updateStrategy
查看updateStrategy定义
kubectl explain statefulset.spec.updateStrategy
类型:OnDelete和RollingUpdate,一般而言使用RollingUpdate逻辑,先更新索引号最大的,再更新索引号最小的

RollingUpdate特有字段:
kubectl explain statefulset.spec.updateStrategy.RollingUpdate
maxUnavailable和partition(分区)
partition(分区):把partition定义为某一个索引号,更新的时候先更新索引号及索引号之后的pod,等这些pod没问题了,便会更新定义了某一个索引号之前的pod

编排运行有状态应用,很少使用statusfulset,一般使用应用专有的Operator,额外提供自定义的资源类型
https://operatorhub.io/
回顾
回顾:
工作负载型控制器:
无状态应用编排:RelicaSet和Deployment
replicas 定义副本数量
selector 定义标签选择器
template 定义pod模板
strategy 定义pod更新策略
maxSurge 定义在更新过程中允许多出来的pod
maxUnavailable 定义在更新过程中允许少去的pod

系统级应用编排:DaemonSet
replicas
selector
template
strategy
maxUnavailable 只能定义在更新过程中允许少去的pod

有状态应用编排:StatefulSet
运维管理逻辑需要自行封装代码
pod Template
command: 定义复杂的运维操作代码作为前置代码,最后才能运行容器应用

serviceName: headless Service
replicas
selector
template
volumeClaimTemplate
strategy
maxUnavailable
partition
podManagementPolicy
OrderedReady
Parallel


分布式应用的协议:
paxos
zab
raft

有状态应用编排:Operator: CoreOS
Operator Framework SDK
Operator:高级控制器,专用于某个特定的有状态应用
CRD:Customed Resource Defination,自定义资源类型

Operator: strimzi-cluster-operator

~# kubectl api-resources --api-group=kafka.strimzi.io

https://operatorhub.io/

Oracle = InnoDBCluster

作业编排:Job和CronJob
作业:有退出时间
restartPolicy(重启策略): OnFailure, Never

Job关键字段:
completions #完成的次数
parallelism ##并行数,要小于等于完成数

CronJob是在Job基础上,提供了时间编排
schedule #调度时间设定,必选字段;
jobTemplate #job作业模板,必选字段;

1、StatefulSet
demodb: 分布式DB, 支持数据持久化,自动支持数据复制
9907/tcp
上传数据:
curl -L -XPUT -T /path/to/file http://demodb:9907/set/KEY_NAME
获取数据:
curl http://demodb:9907/get/KEY_NAME

updateStrategy:
type: RollingUpdate
rollingUpdate:
maxUnavailable: 1
partition: 0

以上是关于21有状态应用编排StatefulSet的主要内容,如果未能解决你的问题,请参考以下文章

从零开始入门 K8s | 有状态应用编排 - StatefulSet

k8s中statefulset资源类型的深入理解

#yyds干货盘点#K8S 之命令行应用编排

K8s中的StatefulSet应用

Statefulset的拓扑状态

云原生架构 - 备份和恢复 Kubernetes 集群