Flink集群搭建

Posted QYHuiiQ

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Flink集群搭建相关的知识,希望对你有一定的参考价值。

  • 前置Hadoop2.7.5集群搭建:

https://blog.csdn.net/QYHuiiQ/article/details/123055389

  • 集群角色分配
HostnameIPRole
hadoop01192.168.126.132JobManager
hadoop02192.168.126.133TaskManager
hadoop03192.168.126.134TaskManager
  • 下载flink

https://archive.apache.org/dist/flink/flink-1.13.0/

将压缩包上传服务器并解压:

[root@hadoop01 wyh]# tar -zxvf flink-1.13.0-bin-scala_2.12.tgz

  •  配置JobManager节点
[root@hadoop01 conf]# pwd
/usr/local/wyh/flink-1.13.0/conf
[root@hadoop01 conf]# vi flink-conf.yaml
#将下面的配置修改为JobManager的主机名
jobmanager.rpc.address: hadoop01
  • 配置TaskManager节点
[root@hadoop01 conf]# pwd
/usr/local/wyh/flink-1.13.0/conf
[root@hadoop01 conf]# vi workers
[root@hadoop01 conf]# cat workers
hadoop02
hadoop03
  • 将hadoop01上的flink包分发至hadoop02和haddop03机器上
[root@hadoop01 wyh]# scp -r flink-1.13.0/ hadoop02:$PWD
[root@hadoop01 wyh]# scp -r flink-1.13.0/ hadoop03:$PWD
  •  启动flink集群
[root@hadoop01 bin]# pwd
/usr/local/wyh/flink-1.13.0/bin
[root@hadoop01 bin]# ./start-cluster.sh
Starting cluster.
Starting standalonesession daemon on host hadoop01.
Starting taskexecutor daemon on host hadoop02.
Starting taskexecutor daemon on host hadoop03.
  • 启动后查看三台机器上的进程

 

 访问Web:

http://192.168.126.132:8081/

 默认情况下每个TaskManager的任务槽是1,这里我们有两个TaskManager。

停掉flinnk集群。

[root@hadoop01 bin]# pwd
/usr/local/wyh/flink-1.13.0/bin
[root@hadoop01 bin]# ./stop-cluster.sh

然后我们尝试用Yarn模式启动集群,前提是要启动Hadoop。

  • 启动Hadoop集群
[root@hadoop01 hadoop-2.7.5]# pwd
/usr/local/wyh/hadoop-2.7.5
[root@hadoop01 hadoop-2.7.5]# start-all.sh
  • 以Yarn模式启动Flink集群
[root@hadoop01 bin]# ./yarn-session.sh -nm test-yarn
#此处nm参数后面跟的是自定义的命名空间

启动成功:

 访问UI:

 

 

Flink1.8 集群搭建完全指南(1):Hadoop伪分布式

参考技术A Flink是目前在国内非常流行的大数据的计算框架,其设计理念可以完美的实现数据的批流计算一体化。Flink的集群,如果要使用到JobManager的HA,以及Yarn的资源调度的话,整体的部署过程还是比较复杂的。本系列文章将完整介绍Hadoop,Kerberos,SASL,Yarn,以及Flink集群的搭建过程,一步步完成整个系统环境的部署。

Hadoop的HDFS在Flink中用作JobManager的HA,Yarn可以用于Flink任务的资源调度,因此是必不可少的。下面我们先搭建好一个Hadoop的集群。

对于一些不熟悉Hadoop集群的搭建的同学,我们先来看下伪分布式集群的搭建,可以快速的熟悉简化的配置过程,以及Hadoop的各配置文件等。

以下是我用于部署该服务的机器:

在伪分布式集群中,所有的服务都在同一节点启动,但它们之间也同样通过ssh的方式访问,所以需要配置ssh免密码登录,配置的方式如下:

测试以下命令,成功跳转即可:

在集群搭建完成后,可以运行Hadoop的示例任务,检查集群是否能够正常工作,命令如下:

该程序会打印PI的值,则执行成功。在Yarn的Web页面,可以看到有一个成功的Application。

下一节我们会介绍Hadoop的分布式集群,Kerberos和SASL等的部署。

以上是关于Flink集群搭建的主要内容,如果未能解决你的问题,请参考以下文章

使用docker搭建flink集群

大数据Flink进阶:Flink集群部署

[4] Flink大数据流式处理利剑: Flink集群安装和运行

大数据(9b)Flink集群部署

哪里可以找到flink集群部署的详细步骤

04 flink 集群搭建