Flink集群搭建

Posted 2023-04-07 QYHuiiQ

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Flink集群搭建相关的知识，希望对你有一定的参考价值。

前置Hadoop2.7.5集群搭建：

https://blog.csdn.net/QYHuiiQ/article/details/123055389

集群角色分配

Hostname	IP	Role
hadoop01	192.168.126.132	JobManager
hadoop02	192.168.126.133	TaskManager
hadoop03	192.168.126.134	TaskManager

下载flink

https://archive.apache.org/dist/flink/flink-1.13.0/

将压缩包上传服务器并解压：

[root@hadoop01 wyh]# tar -zxvf flink-1.13.0-bin-scala_2.12.tgz

配置JobManager节点

[root@hadoop01 conf]# pwd
/usr/local/wyh/flink-1.13.0/conf
[root@hadoop01 conf]# vi flink-conf.yaml
#将下面的配置修改为JobManager的主机名
jobmanager.rpc.address: hadoop01

配置TaskManager节点

[root@hadoop01 conf]# pwd
/usr/local/wyh/flink-1.13.0/conf
[root@hadoop01 conf]# vi workers
[root@hadoop01 conf]# cat workers
hadoop02
hadoop03

将hadoop01上的flink包分发至hadoop02和haddop03机器上

[root@hadoop01 wyh]# scp -r flink-1.13.0/ hadoop02:$PWD
[root@hadoop01 wyh]# scp -r flink-1.13.0/ hadoop03:$PWD

启动flink集群

[root@hadoop01 bin]# pwd
/usr/local/wyh/flink-1.13.0/bin
[root@hadoop01 bin]# ./start-cluster.sh
Starting cluster.
Starting standalonesession daemon on host hadoop01.
Starting taskexecutor daemon on host hadoop02.
Starting taskexecutor daemon on host hadoop03.

启动后查看三台机器上的进程

访问Web:

http://192.168.126.132:8081/

默认情况下每个TaskManager的任务槽是1，这里我们有两个TaskManager。

停掉flinnk集群。

[root@hadoop01 bin]# pwd
/usr/local/wyh/flink-1.13.0/bin
[root@hadoop01 bin]# ./stop-cluster.sh

然后我们尝试用Yarn模式启动集群，前提是要启动Hadoop。

启动Hadoop集群

[root@hadoop01 hadoop-2.7.5]# pwd
/usr/local/wyh/hadoop-2.7.5
[root@hadoop01 hadoop-2.7.5]# start-all.sh

以Yarn模式启动Flink集群

[root@hadoop01 bin]# ./yarn-session.sh -nm test-yarn
#此处nm参数后面跟的是自定义的命名空间

启动成功：

访问UI:

Flink1.8 集群搭建完全指南(1)：Hadoop伪分布式

参考技术A Flink是目前在国内非常流行的大数据的计算框架，其设计理念可以完美的实现数据的批流计算一体化。Flink的集群，如果要使用到JobManager的HA，以及Yarn的资源调度的话，整体的部署过程还是比较复杂的。本系列文章将完整介绍Hadoop，Kerberos，SASL，Yarn，以及Flink集群的搭建过程，一步步完成整个系统环境的部署。

Hadoop的HDFS在Flink中用作JobManager的HA，Yarn可以用于Flink任务的资源调度，因此是必不可少的。下面我们先搭建好一个Hadoop的集群。

对于一些不熟悉Hadoop集群的搭建的同学，我们先来看下伪分布式集群的搭建，可以快速的熟悉简化的配置过程，以及Hadoop的各配置文件等。

以下是我用于部署该服务的机器：

在伪分布式集群中，所有的服务都在同一节点启动，但它们之间也同样通过ssh的方式访问，所以需要配置ssh免密码登录，配置的方式如下：

测试以下命令，成功跳转即可：

在集群搭建完成后，可以运行Hadoop的示例任务，检查集群是否能够正常工作，命令如下：

该程序会打印PI的值，则执行成功。在Yarn的Web页面，可以看到有一个成功的Application。

下一节我们会介绍Hadoop的分布式集群，Kerberos和SASL等的部署。

以上是关于Flink集群搭建的主要内容，如果未能解决你的问题，请参考以下文章