K8S系列深入解析有状态服务
Posted 颜淡慕潇
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了K8S系列深入解析有状态服务相关的知识,希望对你有一定的参考价值。
目录
序言
在你想要放弃的时候,想想是什么让你当初坚持走到了这里。
Kubernetes (k8s) 是一个容器编排平台,允许在容器中运行应用程序和服务。今天学习一下有状态服务。
有状态服务是一种特殊类型的服务,它们需要保持数据的状态,以确保可靠性和一致性。在 Kubernetes 中,有状态服务通常是指需要持久化数据存储的服务,如数据库服务。
文章标记颜色说明:
- 黄色:重要标题
- 红色:用来标记结论
- 绿色:用来标记一级论点
- 蓝色:用来标记二级论点
1 基本介绍
在 Kubernetes 中,有状态服务可以使用 StatefulSet 来进行部署和管理。
StatefulSet 可以确保有状态服务的有序部署和缩放,并在节点失败时自动重新启动实例。
与 Deployment 不同,StatefulSet 提供了稳定的网络标识符和稳定的存储卷名称,以确保有状态服务在重新调度后仍能够保持其身份和数据。
以下是有状态服务在 Kubernetes 中的一些重要概念和实践:
Headless Service:Headless Service 是一种没有 Cluster IP 的 Service,它提供了一个稳定的 DNS 记录,以便有状态服务可以通过 DNS 查找彼此。Headless Service 通常与 StatefulSet 配合使用,以确保每个 Pod 都有唯一的 DNS 记录和稳定的网络标识符。
PersistentVolume:PersistentVolume 是一种 Kubernetes 资源,它表示一个持久化存储卷。有状态服务通常使用 PersistentVolume 来持久化存储数据。
StatefulSet:StatefulSet 是一种 Kubernetes 资源,用于部署有状态服务。StatefulSet 可以确保有序部署和缩放,并在节点故障时自动重新启动实例。StatefulSet 还提供了稳定的网络标识符和稳定的存储卷名称,以确保有状态服务在重新调度后仍能够保持其身份和数据。
Init Containers:Init Containers 是一种特殊类型的容器,它们在应用程序容器启动之前运行,并可以执行一些初始化任务,例如创建数据库或检查数据完整性。有状态服务通常使用 Init Containers 来进行一些必要的初始化操作。
总之,在 Kubernetes 中管理有状态服务需要使用一些特定的概念和实践,例如 Headless Service、PersistentVolume、StatefulSet 和 Init Containers。
这些工具和实践可以确保有状态服务的可靠性和一致性,并使其在节点故障和重新调度时能够正确地恢复和保持状态。
2 使用介绍
2.1 Headless Service
Headless Service 是 Kubernetes 中的一种服务类型,它不会分配 Cluster IP,并且不会进行负载均衡。
相反,它返回与服务中的每个端点相对应的 DNS 记录,这些记录可以用于直接访问这些端点。
Headless Service 通常用于需要直接与 Pod 进行通信的情况,例如 StatefulSet。
下面是一个使用 Headless Service 的示例代码:
apiVersion: v1
kind: Service
metadata:
name: my-headless-service #
spec:
clusterIP: None
selector:
app: my-app
ports:
- name: http
port: 80
targetPort: 8080
---
apiVersion: apps/v1
kind: StatefulSet
metadata:
name: my-statefulset
spec:
serviceName: my-headless-service
replicas: 3
selector:
matchLabels:
app: my-app
template:
metadata:
labels:
app: my-app
spec:
containers:
- name: my-container
image: my-image
ports:
- containerPort: 8080
env:
- name: MY_POD_NAME
valueFrom:
fieldRef:
fieldPath: metadata.name
- 在上述示例中,定义了一个 Headless Service,名为
my-headless-service
,并将其设置为clusterIP: None
,这样它就不会分配 Cluster IP。- 然后,定义了一个 StatefulSet,名为
my-statefulset
,并指定了serviceName: my-headless-service
,这意味着 StatefulSet 将使用我们定义的 Headless Service。- 还指定了
replicas: 3
,这意味着我们将有三个 Pod。每个 Pod 包含一个名为my-container
的容器,该容器使用名为my-image
的映像,并公开端口 8080。- 还将
MY_POD_NAME
环境变量设置为 Pod 的名称,以便容器可以使用该名称来识别自己。- 这是一个基本的 Headless Service 示例,当访问服务时,它将返回每个 Pod 的 DNS 记录,可以使用这些记录来直接访问每个 Pod。
2.2 PersistentVolume
PersistentVolume (PV)是 Kubernetes 中的一种资源对象,用于将存储系统的抽象层提升到Kubernetes平台上
它提供了一种独立于 Pod 的方式来管理和使用存储资源,以使应用程序在不同的节点上运行时能够使用相同的存储资源,使得 Pod 可以在多个节点之间移动而不会丢失数据。
以下是一个使用 PersistentVolume 的示例:
PersistentVolume提供了一种抽象机制,用于将存储资源分配给应用程序,而无需关心底层存储系统的细节。
下面是一个PersistentVolume的示例:
apiVersion: v1
kind: PersistentVolume #资源类型
metadata:
name: pv-nfs
spec:
storageClassName: nfs-storage
capacity:
storage: 10Gi
accessModes:
- ReadWriteMany
nfs:
path: /mnt/data
server: nfs.example.com
在这个示例中,创建了一个名为pv-nfs的PersistentVolume对象,它使用了nfs-storage存储类。
它有一个10GB的存储容量,可以同时被多个节点以读写方式访问。底层存储是一个NFS服务器,挂载点为/mnt/data。
接下来是一个使用PersistentVolume的示例Deployment:
apiVersion: apps/v1
kind: Deployment #资源类型
metadata:
name: nginx-deployment
spec:
replicas: 3
selector:
matchLabels:
app: nginx
template:
metadata:
labels:
app: nginx
spec:
volumes:
- name: nginx-persistent-storage
persistentVolumeClaim:
claimName: nginx-pvc
containers:
- name: nginx
image: nginx:latest
ports:
- containerPort: 80
volumeMounts:
- name: nginx-persistent-storage
mountPath: /usr/share/nginx/html
在这个示例中,创建了一个名为nginx-deployment的Deployment对象,它有三个副本。
这个Deployment对象使用了一个名为nginx-pvc的PersistentVolumeClaim对象。
Deployment中的Pod可以通过名为nginx-persistent-storage的卷来访问该PersistentVolumeClaim。Pod中的容器使用了这个卷,并将它挂载到容器的/usr/share/nginx/html目录中。
最后,下面是一个PersistentVolumeClaim的示例:
apiVersion: v1
kind: PersistentVolumeClaim #资源类型
metadata:
name: nginx-pvc
spec:
storageClassName: nfs-storage
accessModes:
- ReadWriteMany
resources:
requests:
storage: 10Gi
在这个示例中,创建了一个名为nginx-pvc的PersistentVolumeClaim对象,它使用了nfs-storage存储类。它请求10GB的存储空间,并且可以同时被多个节点以读写方式访问。
以上是PersistentVolume的示例和使用方式,通过这些示例,你可以了解到如何在Kubernetes中使用PersistentVolume资源对象。
2.3 StatefulSet
StatefulSet是Kubernetes中的一种资源对象,用于管理有状态应用程序的部署。与Deployment等其他部署对象不同,StatefulSet提供了有状态应用程序所需的唯一标识符和稳定的网络标识符。
以下是一个StatefulSet的示例,用于运行一个具有持久化存储的mysql数据库。
apiVersion: apps/v1
kind: StatefulSet #资源类型
metadata:
name: mysql
spec:
serviceName: mysql
replicas: 3
selector:
matchLabels:
app: mysql
template:
metadata:
labels:
app: mysql
spec:
containers:
- name: mysql
image: mysql:5.7
env:
- name: MYSQL_ROOT_PASSWORD
value: "password"
ports:
- containerPort: 3306
volumeMounts:
- name: mysql-persistent-storage
mountPath: /var/lib/mysql
volumeClaimTemplates:
- metadata:
name: mysql-persistent-storage
spec:
accessModes: [ "ReadWriteOnce" ]
resources:
requests:
storage: 10Gi
让我们逐个解释上面的代码:
apiVersion
:指定使用的Kubernetes API版本。kind
:指定要创建的资源类型。metadata.name
:为StatefulSet指定唯一的名称。spec.serviceName
:为StatefulSet中所有Pods指定唯一的服务名称,以便其他应用程序可以通过DNS解析器访问它们。spec.replicas
:指定要创建的Pod副本数。spec.selector
:指定要部署的Pod的标签。spec.template
:为要部署的Pod定义一个模板。spec.template.metadata.labels
:为Pod定义标签,这些标签将用于将Pod与StatefulSet相关联。spec.template.spec.containers
:为要部署的容器定义一个列表。spec.template.spec.containers.name
:为容器指定一个名称。spec.template.spec.containers.image
:指定要使用的容器映像。spec.template.spec.containers.env
:定义容器的环境变量。spec.template.spec.containers.ports
:为容器指定要公开的端口。spec.template.spec.containers.volumeMounts
:定义要将持久卷挂载到容器的路径。volumeClaimTemplates
:为每个Pod创建一个持久卷声明,这些声明将指向上面定义的PersistentVolumeClaim(PVC)。
总的来说,以上示例中定义了一个MySQL StatefulSet,它包括3个Pods,每个Pod都挂载了一个10GB的持久卷,用于存储MySQL数据库。这些Pods具有唯一的名称(例如,mysql-0,mysql-1,mysql-2),并具有稳定的网络标识符(例如,mysql-0.mysql,mysql-1.mysql,mysql-2.mysql),使它们可以轻松地与其他应用程序进行通信。
2.4 Init Containers
Kubernetes (k8s) Init Containers是一种特殊类型的容器,它们用于在Pod中的主容器启动之前执行一些初始化任务。这些初始化任务可以包括预装软件、下载数据、初始化数据库等操作。
Init Containers会按照定义的顺序运行,并且只有在每个Init容器完成其任务后才会继续启动主容器。
这使得Kubernetes可以更好地控制和管理容器应用程序的生命周期和依赖关系。
下面是一个Init容器的示例定义:
apiVersion: v1
kind: Pod #资源类型
metadata:
name: mypod
spec:
containers:
- name: main-container
image: nginx:latest
initContainers:
- name: init-myservice
image: busybox:latest
command: ['sh', '-c', 'until nslookup myservice; do echo waiting for myservice; sleep 2; done;']
在这个示例中,定义了一个Pod,其中包含一个名为
main-container
的容器和一个名为init-myservice
的Init容器。Init容器使用busybox镜像,并使用命令
nslookup
检查名为myservice
的服务是否可以解析。如果它无法解析,它将等待2秒钟并重试,直到成功为止。一旦Init容器完成它的任务,Kubernetes将继续启动主容器。
Init容器的代码示例如下:
apiVersion: v1
kind: Pod #资源类型
metadata:
name: mypod
spec:
initContainers:
- name: init-myservice
image: busybox:latest
command: ['sh', '-c', 'until nslookup myservice; do echo waiting for myservice; sleep 2; done;']
- name: init-mydbservice
image: busybox:latest
command: ['sh', '-c', 'until nc -zv mydb 3306; do echo waiting for mydb; sleep 2; done;']
containers:
- name: main-container
image: nginx:latest
在这个示例中,定义了两个Init容器:
init-myservice
和init-mydbservice
。
- 第一个容器检查是否可以解析
myservice
服务,- 第二个容器检查是否可以连接到
mydb
数据库的3306端口。一旦两个Init容器都完成它们的任务,Kubernetes将继续启动主容器。
3 问题
思考一下这几个问题:
- 什么是有状态服务?如何与无状态服务区分开来?
- 有哪些常见的有状态服务?它们的特点是什么?
- 如何在 Kubernetes 中管理有状态服务?
- 如何进行有状态服务的伸缩?
- 如何实现有状态服务的高可用性?
- 如何进行有状态服务的备份和恢复?
- 如何进行有状态服务的数据持久化?
- 如何进行有状态服务的版本控制和滚动升级?
- 如何进行有状态服务的监控和故障排查?
- 有没有使用过 StatefulSet,能介绍一下它的特点和用法?
下篇文章,会解答这几个问题。
4 投票
死磕 java线程系列之线程池深入解析——生命周期
(手机横屏看源码更方便)
注:java源码分析部分如无特殊说明均基于 java8 版本。
注:线程池源码部分如无特殊说明均指ThreadPoolExecutor类。
简介
上一章我们一起重温了下线程的生命周期(六种状态还记得不?),但是你知不知道其实线程池也是有生命周期的呢?!
问题
(1)线程池的状态有哪些?
(2)各种状态下对于任务队列中的任务有何影响?
先上源码
其实,在我们讲线程池体系结构的时候,讲了一些方法,比如shutDown()/shutDownNow(),它们都是与线程池的生命周期相关联的。
我们先来看一下线程池ThreadPoolExecutor中定义的生命周期中的状态及相关方法:
private final AtomicInteger ctl = new AtomicInteger(ctlOf(RUNNING, 0));
private static final int COUNT_BITS = Integer.SIZE - 3; // =29
private static final int CAPACITY = (1 << COUNT_BITS) - 1; // =000 11111...
// runState is stored in the high-order bits
private static final int RUNNING = -1 << COUNT_BITS; // 111 00000...
private static final int SHUTDOWN = 0 << COUNT_BITS; // 000 00000...
private static final int STOP = 1 << COUNT_BITS; // 001 00000...
private static final int TIDYING = 2 << COUNT_BITS; // 010 00000...
private static final int TERMINATED = 3 << COUNT_BITS; // 011 00000...
// 线程池的状态
private static int runStateOf(int c) { return c & ~CAPACITY; }
// 线程池中工作线程的数量
private static int workerCountOf(int c) { return c & CAPACITY; }
// 计算ctl的值,等于运行状态“加上”线程数量
private static int ctlOf(int rs, int wc) { return rs | wc; }
从上面这段代码,我们可以得出:
(1)线程池的状态和工作线程的数量共同保存在控制变量ctl中,类似于AQS中的state变量,不过这里是直接使用的AtomicInteger,这里换成unsafe+volatile也是可以的;
(2)ctl的高三位保存运行状态,低29位保存工作线程的数量,也就是说线程的数量最多只能有(2^29-1)个,也就是上面的CAPACITY;
(3)线程池的状态一共有五种,分别是RUNNING、SHUTDOWN、STOP、TIDYING、TERMINATED;
(4)RUNNING,表示可接受新任务,且可执行队列中的任务;
(5)SHUTDOWN,表示不接受新任务,但可执行队列中的任务;
(6)STOP,表示不接受新任务,且不再执行队列中的任务,且中断正在执行的任务;
(7)TIDYING,所有任务已经中止,且工作线程数量为0,最后变迁到这个状态的线程将要执行terminated()钩子方法,只会有一个线程执行这个方法;
(8)TERMINATED,中止状态,已经执行完terminated()钩子方法;
流程图
下面我们再来看看这些状态之间是怎么流转的:
(1)新建线程池时,它的初始状态为RUNNING,这个在上面定义ctl的时候可以看到;
(2)RUNNING->SHUTDOWN,执行shutdown()方法时;
(3)RUNNING->STOP,执行shutdownNow()方法时;
(4)SHUTDOWN->STOP,执行shutdownNow()方法时【本文由公从号“彤哥读源码”原创】;
(5)STOP->TIDYING,执行了shutdown()或者shutdownNow()后,所有任务已中止,且工作线程数量为0时,此时会执行terminated()方法;
(6)TIDYING->TERMINATED,执行完terminated()方法后;
源码分析
你以为贴个状态的源码,画个图就结束了嘛?那肯定不能啊,下面让我们一起来看看源码中是怎么控制的。
(1)RUNNING
RUNNING,比较简单,创建线程池的时候就会初始化ctl,而ctl初始化为RUNNING状态,所以线程池的初始状态就为RUNNING状态。
// 初始状态为RUNNING
private final AtomicInteger ctl = new AtomicInteger(ctlOf(RUNNING, 0));
(2)SHUTDOWN
执行shutdown()方法时把状态修改为SHUTDOWN,这里肯定会成功,因为advanceRunState()方法中是个自旋,不成功不会退出。
public void shutdown() {
final ReentrantLock mainLock = this.mainLock;
mainLock.lock();
try {
checkShutdownAccess();
// 修改状态为SHUTDOWN
advanceRunState(SHUTDOWN);
// 标记空闲线程为中断状态
interruptIdleWorkers();
onShutdown();
} finally {
mainLock.unlock();
}
tryTerminate();
}
private void advanceRunState(int targetState) {
for (;;) {
int c = ctl.get();
// 如果状态大于SHUTDOWN,或者修改为SHUTDOWN成功了,才会break跳出自旋
if (runStateAtLeast(c, targetState) ||
ctl.compareAndSet(c, ctlOf(targetState, workerCountOf(c))))
break;
}
}
(3)STOP
执行shutdownNow()方法时,会把线程池状态修改为STOP状态,同时标记所有线程为中断状态。
public List<Runnable> shutdownNow() {
List<Runnable> tasks;
final ReentrantLock mainLock = this.mainLock;
mainLock.lock();
try {
checkShutdownAccess();
// 修改为STOP状态
advanceRunState(STOP);
// 标记所有线程为中断状态
interruptWorkers();
tasks = drainQueue();
} finally {
// 【本文由公从号“彤哥读源码”原创】
mainLock.unlock();
}
tryTerminate();
return tasks;
}
至于线程是否响应中断其实是在队列的take()或poll()方法中响应的,最后会到AQS中,它们检测到线程中断了会抛出一个InterruptedException异常,然后getTask()中捕获这个异常,并且在下一次的自旋时退出当前线程并减少工作线程的数量。
private Runnable getTask() {
boolean timedOut = false; // Did the last poll() time out?
for (;;) {
int c = ctl.get();
int rs = runStateOf(c);
// 如果状态为STOP了,这里会直接退出循环,且减少工作线程数量
// 退出循环了也就相当于这个线程的生命周期结束了
if (rs >= SHUTDOWN && (rs >= STOP || workQueue.isEmpty())) {
decrementWorkerCount();
return null;
}
int wc = workerCountOf(c);
// Are workers subject to culling?
boolean timed = allowCoreThreadTimeOut || wc > corePoolSize;
if ((wc > maximumPoolSize || (timed && timedOut))
&& (wc > 1 || workQueue.isEmpty())) {
if (compareAndDecrementWorkerCount(c))
return null;
continue;
}
try {
// 真正响应中断是在poll()方法或者take()方法中
Runnable r = timed ?
workQueue.poll(keepAliveTime, TimeUnit.NANOSECONDS) :
workQueue.take();
if (r != null)
return r;
timedOut = true;
} catch (InterruptedException retry) {
// 这里捕获中断异常
timedOut = false;
}
}
}
这里有一个问题,就是已经通过getTask()取出来且返回的任务怎么办?
实际上它们会正常执行完毕,有兴趣的同学可以自己看看runWorker()这个方法,我们下一节会分析这个方法。
(4)TIDYING
当执行shutdown()或shutdownNow()之后,如果所有任务已中止,且工作线程数量为0,就会进入这个状态。
final void tryTerminate() {
for (;;) {
int c = ctl.get();
// 下面几种情况不会执行后续代码
// 1. 运行中
// 2. 状态的值比TIDYING还大,也就是TERMINATED
// 3. SHUTDOWN状态且任务队列不为空
if (isRunning(c) ||
runStateAtLeast(c, TIDYING) ||
(runStateOf(c) == SHUTDOWN && ! workQueue.isEmpty()))
return;
// 工作线程数量不为0,也不会执行后续代码
if (workerCountOf(c) != 0) {
// 尝试中断空闲的线程
interruptIdleWorkers(ONLY_ONE);
return;
}
final ReentrantLock mainLock = this.mainLock;
mainLock.lock();
try {
// CAS修改状态为TIDYING状态
if (ctl.compareAndSet(c, ctlOf(TIDYING, 0))) {
try {
// 更新成功,执行terminated钩子方法
terminated();
} finally {
// 强制更新状态为TERMINATED,这里不需要CAS了
ctl.set(ctlOf(TERMINATED, 0));
termination.signalAll();
}
return;
}
} finally {
mainLock.unlock();
}
// else retry on failed CAS
}
}
实际更新状态为TIDYING和TERMINATED状态的代码都在tryTerminate()方法中,实际上tryTerminated()方法在很多地方都有调用,比如shutdown()、shutdownNow()、线程退出时,所以说几乎每个线程最后消亡的时候都会调用tryTerminate()方法,但最后只会有一个线程真正执行到修改状态为TIDYING的地方。
修改状态为TIDYING后执行terminated()方法,最后修改状态为TERMINATED,标志着线程池真正消亡了。
(5)TERMINATED
见TIDYING中分析。
彩蛋
本章我们一起从状态定义、流程图、源码分析等多个角度一起学习了线程池的生命周期,你掌握的怎么样呢?
下一章我们将开始学习线程池执行任务的主流程,对这一块内容感到恐惧的同学可以先看看彤哥之前写的“手写线程池”的两篇文章,对接下来学习线程池的主要流程非常有好处。
以上是关于K8S系列深入解析有状态服务的主要内容,如果未能解决你的问题,请参考以下文章