Hadoop升级和回滚

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Hadoop升级和回滚相关的知识,希望对你有一定的参考价值。

参考技术A 现在软件更新非常快,当在一个已有集群上升级Hadoop时,像其他的软件升级一样,可能会有新的bug或一些会影响到现有应用的非兼容性变更出现。
在任何有实际意义的HDSF系统上,丢失数据是不被允许的,更不用说重新搭建启动HDFS了。HDFS允许管理员退回到之前的Hadoop版本,并将集群的状态回滚到升级之前。更多关于HDFS升级的细节在升级wiki上可以找到。HDFS在一个时间可以有一个这样的备份。 在升级之前,管理员需要用bin/hadoop dfsadmin -finalizeUpgrade(升级终结操作)命令删除存在的备份文件。下面简单介绍一下一般的升级过程:

Pod 升级和回滚

Pod 滚动升级(Deployment)

参考链接

使用kubernetes 进行升级的时候并不需要停止业务,kubectl 支持滚动升级的方式,每次更新一个pod,而不是同时删除整个服务。
目前的kubernetes 版本只支持Replication Controllers的方式实现滚动升级。然而,官方推荐的方式是使用Deployments. Deployments是一个更高级别的控制器,它以声明方式自动执行应用程序的滚动更新,因此推荐使用。
这里将重点介绍使用Deployment的方式。

  1. 创建一个nginx应用的deployment:
apiVersion: apps/v1
kind: Deployment
metadata:
  name: nginx-deployment
  labels:
    app: nginx
spec:
  replicas: 3
  selector:
    matchLabels:
      app: nginx
  template:
    metadata:
      labels:
        app: nginx
    spec:
      containers:
      - name: nginx
        image: nginx:1.7.9
        ports:
        - containerPort: 80

可以看到,创建了3个Pod副本:

# kubectl  get pods
NAME                                READY     STATUS    RESTARTS   AGE
nginx-deployment-75675f5897-jhr26   1/1       Running   0          36m
nginx-deployment-75675f5897-n77ds   1/1       Running   0          36m
nginx-deployment-75675f5897-ns6pn   1/1       Running   0          36m

更新镜像为nginx 1.10.3:

# kubectl  set image deployment nginx-deployment nginx=nginx:1.10.3

# kubectl  get pods
NAME                                READY     STATUS        RESTARTS   AGE
nginx-deployment-75675f5897-n77ds   0/1       Terminating   0          47m
nginx-deployment-75d56bb955-54686   1/1       Running       0          7s
nginx-deployment-75d56bb955-5zxqz   1/1       Running       0          10s
nginx-deployment-75d56bb955-bxqd9   1/1       Running       0          8s

# kubectl  get pods -o wide
NAME                                READY     STATUS    RESTARTS   AGE       IP           NODE
nginx-deployment-75d56bb955-54686   1/1       Running   0          2m        10.2.74.9    10.0.0.3
nginx-deployment-75d56bb955-5zxqz   1/1       Running   0          2m        10.2.74.8    10.0.0.3
nginx-deployment-75d56bb955-bxqd9   1/1       Running   0          2m        10.2.62.16   10.0.0.2

# curl --head 10.2.62.16
HTTP/1.1 200 OK
Server: nginx/1.10.3
Date: Wed, 20 Jun 2018 10:52:10 GMT
Content-Type: text/html
Content-Length: 612
Last-Modified: Tue, 31 Jan 2017 15:01:11 GMT
Connection: keep-alive
ETag: "5890a6b7-264"
Accept-Ranges: bytes

我们也可以直接使用编辑配置文件的方式,直接修改nginx镜像版本为1.12.2:

# kubectl edit deployment nginx-deployment

# kubectl  get pods -o wide
NAME                                READY     STATUS    RESTARTS   AGE       IP           NODE
nginx-deployment-7498dc98f8-756tq   1/1       Running   0          11s       10.2.62.17   10.0.0.2
nginx-deployment-7498dc98f8-g265v   1/1       Running   0          13s       10.2.74.10   10.0.0.3
nginx-deployment-7498dc98f8-hh6wv   1/1       Running   0          10s       10.2.74.11   10.0.0.3

curl  --head 10.2.62.17
HTTP/1.1 200 OK
Server: nginx/1.12.2
...

在进行滚动升级的过程中,Deployment 进行初始化时,创建了一个新的ReplicaSet,新的ReplicaSet 逐渐创建新的Pod 副本,旧的ReplicaSet 逐渐销毁旧的副本,并始终保持副本数量恒定,逐步滚动替换。
可以查看ReplicaSet的状态:

# kubectl  get rs -o  wide
NAME                          DESIRED   CURRENT   READY     AGE       CONTAINERS   IMAGES         SELECTOR
nginx-deployment-7498dc98f8   3         3         3         44m       nginx        nginx:1.12.2   app=nginx,pod-template-hash=3054875494
nginx-deployment-75675f5897   0         0         0         1h        nginx        nginx:1.7.9    app=nginx,pod-template-hash=3123191453
nginx-deployment-75d56bb955   0         0         0         59m       nginx        nginx:1.10.3   app=nginx,pod-template-hash=3181266511

查看更新的状态:

kubectl rollout status deployment/nginx-deployment

在Deployment的定义中,可以通过spec.strategy指定的Pod更新策略,支持两种策略:

  • Recreate(重建):设置spec.strategy.type=Recreate, 表示Deployment在更新Pod的时候,会先杀掉所有正在运行的Pod,然后创建新的Pod。
  • RollingUpdate(滚动更新): 设置 spec.strategy.type=RollingUpdate,表示Deployment会以滚动更新的方式来逐个更新Pod。可以指定

RollingUpdate(滚动更新)有两个主要参数,来控制更新的Pod副本数量:

  • .spec.strategy.rollingUpdate.maxUnavailable : 用于指定Deployment在更新过程中不可用状态的Pod数量上限。该maxUnavailable的数值可以是绝对值正整数,也可以是Pod期望的副本数的百分比(例如10%)。如果设置为百分比,那么系统会先以向下取整的方式计算出绝对值整数,但是当.spec.strategy.rollingUpdate.maxSurge值为0时,其值不能为0。 默认情况下为25%。
  • .spec.strategy.rollingUpdate.maxSurge: 用于指定Deployment更新Pod过程中Pod总数超过Pod期望副本部分的最大值。该maxSurge的数值可以是绝对值(例如5)或Pod期望副本数的百分比(例如10%)。如果设置为百分比,那么系统会先按照向上取整的方式计算出绝对数值。如果MaxUnavailable的值为0,则这个值不能为0,默认值是25%。

需要注意更新Deployment的标签选择器(Label selector)的情况。通常不鼓励更新Deployment 的标签选择器,这样会导致Deployment选择的Pod列表发生变化,也可能与其它控制器产生的冲突。
如果要更新Deployment标签选择器,有以下注意事项:

  • 添加标签选择器时,必须同步修改Deployment配置的Pod标签,为Pod添加新的标签,否则Deployment的更新会报验证错误而失败。更改标签之后,旧的rs将会依旧存在,deployment将无法管理旧的RS。直接执行kubectl delete rs <rs-name>即可删除。
  • 更新标签选择器,即更新选择器中标签的键或值,也会产生与添加选择器标签类似的效果。
  • 删除标签选择器,即从Deployment的标签选择器中删除一个或者多个标签,该Deployment的ReplicaSet 和Pod不会受到任何影响,但需要注意的是,被删除的标签仍然会存在于现有的Pod和ReplicaSet上。

Deployment的回滚

1、查看Deployment部署的历史记录:

kubectl  rollout history deployment/nginx-deployment

如果查看到的结果为None,则需要在创建和更新deployment时加上 --record参数.

2、查看特定的版本信息:

# kubectl  rollout history deployment/nginx-deployment --revision=3

3、撤销本次发布,回滚到上一个版本:

# kubectl rollout undo deployment/nginx-deployment

4、可以指定版本回滚:

# kubectl rollout undo deployment/nginx-deployment --to-revision=2

5、查看回滚状态:

# kubectl rollout status deployments nginx-deployment

Waiting for rollout to finish: 2 out of 3 new replicas have been updated...
Waiting for rollout to finish: 2 out of 3 new replicas have been updated...
Waiting for rollout to finish: 2 out of 3 new replicas have been updated...
Waiting for rollout to finish: 1 old replicas are pending termination...
Waiting for rollout to finish: 1 old replicas are pending termination...
deployment "nginx-deployment" successfully rolled out

暂停和恢复Deployment的部署操作

对于一次复杂的Deplyment配置修改,为了避免频繁触发Deployment的更新操作,可以先暂停Deployment的更新操作,然后进行配置修改,等所有的修改完成后,再恢复Deployment,一次性触发完整的更新操作。这样就可以避免不必要的Deployment的更新操作。

1、 暂停Deployment的操作

# kubectl  rollout pause deployment/nginx-deployment

2、修改deployment的镜像信息:

# kubectl set image deploy/nginx-deployment nginx=nginx:1.12.2

# 查看更新记录,没有变化
# kubectl  rollout history deploy/nginx-deployment
deployments "nginx-deployment"
REVISION  CHANGE-CAUSE
1         <none>
4         <none>
5         <none>

3、再次更新容器资源限制:

# kubectl set resources deployment nginx-deployment -c=nginx --limits=cpu=200m,memory=512Mi

4、恢复Deployment的部署操作

kubectl rollout resume deploy/nginx-deployment

5、历史记录以及更新:

# kubectl  rollout history deploy/nginx-deployment
deployments "nginx-deployment"
REVISION  CHANGE-CAUSE
1         <none>
4         <none>
5         <none>
6         <none>

k8s还提供了针对RC进行滚动升级的方式,使用 kubectl rolling-update 命令来执行。由于RC升级过程无法查看记录,无法进行版本数量的精细化控制,将逐渐被RS取代,所以建议优先使用Deployment的方式完成Pod的部署升级,这里不做讨论。

其他对象的更新策略

DaemonSet的更新策略

  • OnDelete:这是用于向后兼容的默认更新策略。 使用OnDelete更新策略,在更新DaemonSet模板之后,只有在手动删除旧的DaemonSet窗格时才会创建新的DaemonSet Pod。 这与Kubernetes版本1.5或更早版本中的DaemonSet是一致的。
  • RollingUpdate:通过RollingUpdate更新策略,在更新DaemonSet模板后,旧的DaemonSet窗格将被终止,并且将以受控的方式自动创建新的DaemonSet。不过不支持DaemonSet的更新历史记录,并且回滚并不能如Deployment直接通过kubectl rollback 命令来实现。

以上是关于Hadoop升级和回滚的主要内容,如果未能解决你的问题,请参考以下文章

Pod 升级和回滚

再战 k8s(12):Deployment 指导下 Pod 的升级和回滚

升级后 Azure 服务结构持续部署和回滚选项

022.掌握Pod-Pod升级和回滚

Nginx平滑升级和回滚

k8s 读书笔记 - Pod 的升级和回滚