CDH集群spark-shell执行过程分析

Posted 格格巫 MMQ!!

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了CDH集群spark-shell执行过程分析相关的知识,希望对你有一定的参考价值。

目的
刚入门spark,安装的是CDH的版本,版本号spark-core_2.11-2.4.0-cdh6.2.1,部署了cdh客户端(非集群节点),本文主要以spark-shell为例子,对在cdh客户端上提交spark作业原理进行简单分析,加深理解

spark-shell执行
启动spark-shell后,可以发下yarn集群上启动了一个作业,实际上,cdh-spark默认提交作业模式为yarn-client模式,即在本地运行Driver,作业在yarn集群上执行

spark-shell启动过程分析
查看spark-shell路径及内容,$LIB_DIR值为/opt/cloudera/parcels/CDH/lib,所以执行的是/opt/cloudera/parcels/CDH/lib/spark/bin/spark-shell

继续查看/opt/cloudera/parcels/CDH/lib/spark/bin/spark-shell,脚本关键的内容如下:

#!/usr/bin/env bash
if [ -z "

以上是关于CDH集群spark-shell执行过程分析的主要内容,如果未能解决你的问题,请参考以下文章

CDH5.7Hadoop集群搭建(离线版)

多节点火花集群上的 spark-shell 无法在远程工作节点上旋转执行程序

CDH集群之YARN性能调优

0823-5.15.1-HDFS慢导致Hive查询慢问题分析

CENTOS安装CDH和Kudu-1

spark-shell启动spark报错