Kubernetes优雅终止的流程和配置方法(转载)
Posted Serverless和DevOps技术分享
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Kubernetes优雅终止的流程和配置方法(转载)相关的知识,希望对你有一定的参考价值。
Kubernetes优雅终止
概述
Pod 销毁时,会停止容器内的进程,通常在停止的过程中我们需要执行一些善后逻辑,比如等待存量请求处理完以避免连接中断,或通知相关依赖进行清理等,从而实现优雅终止目的。本文介绍在 Kubernetes 场景下,实现容器优雅终止的最佳实践。
容器终止流程
我们先了解下容器在 Kubernetes 环境中的终止流程:
- Pod 被删除,状态置为
Terminating
。 - kube-proxy 更新转发规则,将 Pod 从 service 的 endpoint 列表中摘除掉,新的流量不再转发到该 Pod。
- 如果 Pod 配置了 preStop Hook ,将会执行。
- kubelet 对 Pod 中各个 container 发送
SIGTERM
信号以通知容器进程开始优雅停止。 - 等待容器进程完全停止,如果在
terminationGracePeriodSeconds
内 (默认 30s) 还未完全停止,就发送SIGKILL
信号强制杀死进程。 - 所有容器进程终止,清理 Pod 资源。
业务代码处理 SIGTERM 信号
要实现优雅终止,务必在业务代码里面处理下 SIGTERM
信号,参考 处理 SIGTERM 代码示例 。
别让 shell 导致收不到 SIGTERM 信号
如果容器启动入口使用了脚本 (如 CMD ["/start.sh"]
),业务进程就成了 shell 的子进程,在 Pod 停止时业务进程可能收不到 SIGTERM
信号,因为 shell 不会自动传递信号给子进程。更详细解释请参考 为什么我的容器收不到 SIGTERM 信号 ?
如果解决?请参考 实用技巧: 在 SHELL 中传递信号 。
合理使用 preStop Hook
若你的业务代码中没有处理 SIGTERM
信号,或者你无法控制使用的第三方库或系统来增加优雅终止的逻辑,也可以尝试为 Pod 配置下 preStop,在这里面实现优雅终止的逻辑,示例:
lifecycle:
preStop:
exec:
command:
- /clean.sh
在某些极端情况下,Pod 被删除的一小段时间内,仍然可能有新连接被转发过来,因为 kubelet 与 kube-proxy 同时 watch 到 pod 被删除,kubelet 有可能在 kube-proxy 同步完规则前就已经停止容器了,这时可能导致一些新的连接被转发到正在删除的 Pod,而通常情况下,当应用受到 SIGTERM
后都不再接受新连接,只保持存量连接继续处理,所以就可能导致 Pod 删除的瞬间部分请求失败。
这种情况下,我们也可以利用 preStop 先 sleep 一小下,等待 kube-proxy 完成规则同步再开始停止容器内进程:
lifecycle:
preStop:
exec:
command:
- sleep
- 5s
调整优雅时长
如果需要的优雅终止时间比较长 (preStop + 业务进程停止可能超过 30s),可根据实际情况自定义 terminationGracePeriodSeconds
,避免过早的被 SIGKILL
杀死,示例:
以上是关于Kubernetes优雅终止的流程和配置方法(转载)的主要内容,如果未能解决你的问题,请参考以下文章
Asp.Net Core 3 优雅关闭抛出 OperationCanceledException