spark 开启job history

Posted jason-dong

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了spark 开启job history相关的知识,希望对你有一定的参考价值。

1.首先需要创建spark.history.fs.logDirectory

hadoop fs -mkdir hdfs://ns1:9000/user/hadoop/logs

 

2.修改hadoop-defaults.conf,添加如下内容

spark.eventLog.enabled  true  #允许开启日志
spark.eventLog.dir     hdfs://ns1:9000/user/hadoop/logs #日志存储目录
spark.eventLog.compress true #日志压缩

修改spark-env.sh 添加如下内容

export SPARK_HISTORY_OPTS="-Dspark.history.ui.port=7777 -Dspark.history.retainedApplications=3 -Dspark.history.fs.logDirectory=hdfs://ns1:9000/user/hadoop/logs"

 

-Dspark.history.ui.port=7777   #设置日志监控端口

-Dspark.history.retainedApplications=3  #设置最多保留几个历史任务

-Dspark.history.fs.logDirectory=hdfs://ns1:9000/user/hadoop/logs #设置日志目录

3.启动日志服务

sh /usr/local/spark-2.1.0-bin-hadoop2.7/sbin/start-history-server.sh

 

以上是关于spark 开启job history的主要内容,如果未能解决你的问题,请参考以下文章

Agent History5:Job Activity Monitor 查看Job History的代码

Spark History Server 配置部署

查看Job的执行History

转载Apache Spark Jobs 性能调优

Apache Spark Jobs 性能调优

hadoop job history server