如何重启Cloudera Manager

Posted 2023-05-08

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了如何重启Cloudera Manager相关的知识，希望对你有一定的参考价值。

参考技术A 1、问题的描述：当你利用ClouderaManager部署了CDH的集群后，也许随着你的业务需求，你需要对你的就去哪做一些优化，或者扩展之类的，这个时候你可能需要下载安装一些组件。例如，我最近在阅读Cloudera官方文档的是，看到有一节的内容说到PerformanceManagement的时候，发现为了提升集群的性能，经常会将数据进行压缩，此时就会需要添加一些parcel的安装。2、方法详述：为了能够安装自己想要的parcel的软件包，采用的方式可以：（1）在ClouderaManager的主界面选择“host（主机）”---->parcel，就会出现如下的界面：（2）点击上图的红色按钮（编辑设置）进入设置界面：若是手动下载的parcel包，可以将其放到对应目录下，默认是/opt/cloudera/parcel-repo/目录下。若需要配置远程下载的repo路径，则只需要在旁边点击“+”这个按钮即可。（3）设置好了这两个参数后，回到（1）中的parcel界面，点击检查新parcel按钮即可显示。（4）分配和激活即可。

0007-如何迁移Cloudera Manager节点

温馨提示：要看高清无码套图，请使用手机打开并单击图片放大查看。

1.概述

本文档讲述如何将Cloudera Manager在Kerberos环境下迁移至新的CM节点。通过本文档，您将学习到以下知识：

1.如何迁移Cloudera Manager节点

2.如何迁移MySQL元数据库

3.如何迁移Kerberos MIT KDC

文档主要分为以下几步：

1.准备Cloudera Manager新节点

2.MariaDB数据库迁移（可选）

3.迁移Kerberos MIT KDC（可选）

4.将原CM节点数据迁移至新节点

5.迁移后集群服务验证

这篇文档将着重介绍Cloudera Manager节点迁移，并基于以下假设：

1.CDH环境已搭建并正常运行

2.旧Cloudera Manager节点包含Cloudera Manager Server(即cloudera-scm-server)服务和Cloudera Management Service服务（Alert Publisher/Event Server/Host Monitor/Reports Manager/Service Monitor）

3.集群已完成MIT Kerberos的配置，并正常使用

4.集群Hadoop服务HBase/Hive/HDFS/Hue/Kafka/Oozie/Spark/Spark2/Yarn/Zookeeper正常运行

以下是本次测试环境，但不是本操作手册的硬限制：

1.操作系统：Redhat7.2

2.CM版本：CM5.11.1

3.CDH版本：CDH5.11.1

4.采用ec2-user对集群进行部署

2.准备Cloudera Manager新节点

2.1新CM主机前置条件

操作系统版本与集群操作系统版本一致(Redhat7.2)
关闭防火墙
配置时钟同步，根据当前集群时钟同步服务进行配置
swap已设置为10
关闭透明大页面
关闭SElinux
配置/etc/hosts文件或者使用DNS服务
配置cm和os的yum源
创建mysql驱动的软链接

2.2新主机信息

新主机IP地址：172.31.18.97

新Hostname：ip-172-31-18-97.ap-southeast-1.compute.internal

1.主机操作系统版本

技术分享图片

2.防火墙

技术分享图片

3.时钟同步

技术分享图片

4.swap信息

技术分享图片

5.透明大页面

技术分享图片

6.SElinux信息

技术分享图片

7.host信息

技术分享图片

8.Cloudera Manager和OS的yum 源

技术分享图片

9.在/usr/share/java目录下创建mysql驱动包软链

技术分享图片

2.3安装Cloudera Manager服务

[email protected] log$ sudo yum  -y install cloudera-manager-server cloudera-manager-agent

技术分享图片

安装完成Cloudera Manager后暂时不要启动服务。

注意：新节点的Cloudera Manager版本必须与原Cloudera Manager版本一致;节点上不要安装CDH的其它组件;

2.4安装MariaDB数据库

由于原CM节点安装有MariaDB数据库，所以在新的CM节点也安装MariaDB数据库进行数据迁移（如果不考虑数据库迁移则可以不用安装）

[email protected]  log$ sudo yum -y install mariadb-server mariadb-devel

技术分享图片

初始化MariaDB数据库

 ec2-user @  ip-172-31-18-97 log# sudo systemctl enable mariadb
 [email protected]  log$ sudo systemctl start mariadb
 [email protected]  log$ sudo /usr/bin/mysql\_secure\_installation

技术分享图片

3.MariaDB数据库迁移

如果不做数据库迁移可不跳过该章节

3.1备份原MariaDB数据

将需要迁移的mysql整库导出（可根据需要导出需要的库信息）

[email protected]  ec2-user# mysqldump -u root -p -A >oldmysql.dump

技术分享图片

3.2导入备份数据至新库

1.将备份文件拷贝至新mysql服务上，进行数据导入

[email protected]  ec2-user# mysql -u root -p < oldmysql.dump

技术分享图片

注意：数据导入成功后，需要在mysql client执行命令：FLUSH PRIVILEGES;

4.迁移Kerberos MIT KDC

4.1备份原Kerberos数据库

登录到主KDC服务器上，使用kdb5_util命令备份Kerberos数据库及配置文件

[[email protected] ~]$ sudo kdb5_util dump -verbose kerberosdb.dumpfile

HTTP/[email protected]

HTTP/[email protected]

….

zookeeper/[email protected]

[[email protected] ~]$

/etc/krb5.conf

/var/kerberos/krb5kdc/kdc.conf

/var/kerberos/krb5kdc/kadm5.acl

技术分享图片

4.2恢复备份数据至新库

1.在新节点安装Kerberos服务：

yum -y install krb5-server krb5-libs krb5-auth-dialog krb5-workstation

将4.1备份的数据拷贝到新节点上，通过如下操作将数据还原到Kerberos数据库

2.修改krb5.conf文件，将该文件覆盖/etc目录下的krb5.conf

技术分享图片

将上述标红部分修改为当前主机ip或者hostname

3.将kdc.conf和kadm5.acl文件拷贝至/var/kerberos/krb5kdc目录下进行覆盖

yum -y install krb5-server krb5-libs krb5-auth-dialog krb5-workstation

技术分享图片

4.恢复kerberos数据库，在krb5kdc和kadmin服务停止的情况下进行如下操作

技术分享图片

注意：此处需要创建kerberos数据库，然后在做数据导入否则krb5kdc和kadmin服务不能正常启动；

启动krb5kdc和kadmin服务

[email protected] kerberos\_bak$ sudo  systemctl restart krb5kdc

[email protected]172-31-18-97 kerberos\_bak$ sudo  systemctl stop krb5kdc

验证Kerberos是否正常，使用导入的user_r进行测试

技术分享图片

4.3更新集群的krb5.conf配置

将KDC主服务器上的/etc/krb5.conf文件拷贝至集群中所有的节点，并验证Kerberos是否正常。

技术分享图片

5.将原CM节点数据迁移至新节点

5.1备份原CM节点数据

主要备份CM的监控数据和管理信息，数据目录包括:

/var/lib/cloudera-host-monitor

/var/lib/cloudera-service-monitor

/var/lib/cloudera-scm-server

/var/lib/cloudera-scm-eventserver

/var/lib/cloudera-scm-headlamp

技术分享图片

注意：将备份命令压缩传输，防止目录的属主和权限变化

5.2修改CM的数据库配置信息

修改新CM的数据库配置文件/etc/cloudera-scm-server/db.properties，配置文件内容

技术分享图片

根据自己的配置信息对标红部分进行修改

技术分享图片

5.3CM备份数据导入新节点

将原CM上备份的数据拷贝到新CM节点上

技术分享图片

通过如下命令将备份数据还原至对应目录

技术分享图片

5.4更新集群所有节点的CM Server指向

修改集群所有节点上/etc/cloudera-scm-agent/config.ini文件中server_host值为新CM节点的hostname

技术分享图片

5.5将原CM节点的Cloudera Management Service角色迁移至新节点

启动新CM节点的cloudera-scm-server和cloudera-scm-agent服务

[email protected] 253back# sudo systemctl  start cloudera-scm-serve

[email protected] 253back# sudo systemctl  start cloudera-scm-agent

注意：在新CM节点上启动cloudera-scm-agent服务后，会将CM节点的信息添加到cm库的HOSTS表中，查看新CM节点对应的HOSTS_ID

登录mysql数据库将，查看cm.HOSTS表中的Cloudera Manager的host信息

技术分享图片

未迁移前可以通过CM管理界面看到新CM节点是没有任何角色

技术分享图片

通过如下命令，将旧CM的角色迁移至新CM节点上

update ROLES set HOST_ID=11 where NAME like ‘mgmt%‘;

技术分享图片

执行操作后，原CM节点的角色被迁移至新CM节点

技术分享图片

通过CM管理界面将原CM节点从集群删除

技术分享图片

将原CM节点删除

技术分享图片

由于集群配置了Kerberos，则需要更新Kerberos的server，如果Kerberos未迁移则不需要考虑此步

技术分享图片

如果集群启用Kerberos，则需要为新CM节点生成keytab（如果未启用集群则跳过此步）

技术分享图片

通过CM管理界面启动Cloudera Management Service

技术分享图片

由于做了数据库迁移，所以需要修改hive/hue/oozie对应的数据库配置（未做数据库迁移可跳过此步）

技术分享图片

进行以上修改后重启集群

6.迁移后集群服务验证

原CM的运行界面，历史监控数据

技术分享图片

登录CM管理平台，查看集群状态正常

技术分享图片

迁移后可以查看正常查看集群的历史监控数据

技术分享图片

Hue访问及操作正常

技术分享图片

HDFS访问及操作正常

技术分享图片

HBase通过hue和shell正常操作

技术分享图片

7.常见问题分析

1.问题一

问题现象：

技术分享图片

问题原因：

由于cloudera-scm-agent服务于supervisord之间通信异常导致。

解决方法：

将告警节点上的supervisord进程杀死，然后重启agent服务

技术分享图片

2.问题二

问题现象：

技术分享图片

问题原因：

由于在CM迁移时，未迁移/opt/cloudera/csd目录导致。

解决方法：

将原CM节点上/opt/cloudera/csd目录拷贝至新CM节点对应的目录

技术分享图片

重启cloudera-scm-server服务

[[email protected] 253back]# sudo systemctl start cloudera-scm-server

3.问题三

问题现象：

Service Monitor启动失败，异常信息如下

技术分享图片

问题原因：

由于CM迁移时，/var/lib/cloudera-service-monitor目录的文件缺失导致

解决方法：

将/var/lib/cloudera-service-monitor目录的数据重新覆盖

4.问题四

现象描述：

在集群迁移完成后，集群启动后做了高可用服务的NameNode和ResourceManager服务均不能正常显示主备节点，HDFS的汇总信息无法正常显示

问题原因：

由于集群配置了kerberos，新CM节点未生成keytab导致

解决方法：

将CM节点的所有服务停掉，然后生成该主机的keytab

技术分享图片

8.扩展

如何在不停止集群服务的情况下进行Cloudera Manager迁移，需要满足如下条件：

新CM节点的hostname与IP地址与旧CM节点一致；
如果需要迁移数据库，则新数据库的hostname与IP地址与原数据库一致，且需要将原数据库的数据导入到新库中；
如果需要迁移Kerberos MIT KDC，则新MIT KDC所在节点与旧MIT KDC节点的hostname与IP地址一致，且需要将旧MIT KDC数据库数据导入新MIT KDC数据库中；

注意：如果只做第1步操作，则不需要重启hadoop集群相关服务，并且不会影响hadoop集群现有作业；如果进行2、3步操作会对集群作业造成短暂影响，但不需要重启hadoop集群相关服务；

醉酒鞭名马，少年多浮夸！岭南浣溪沙，呕吐酒肆下！挚友不肯放，数据玩的花！
温馨提示：要看高清无码套图，请使用手机打开并单击图片放大查看。

以上是关于如何重启Cloudera Manager的主要内容，如果未能解决你的问题，请参考以下文章

运行 sqoop list 数据库命令时出现 cloudera 链接错误

无法检测 Cloudera Manager Server:CDH安装的一个坑:could not contact scm server at localhost:7182, giving up

使用cloudera manager 安装HDFS，Namenode文件系统检查一直在飙涨

如何在 Cloudera 上挂载 HDFS？

如何下载Cloudera归档网页上看不到的zookeeper?

CDH 06Cloudera Manager服务添加&&HDFSYARN等HA高可用(markdown新版二)