Spark中的日志聚合的配置

Posted 曹军

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Spark中的日志聚合的配置相关的知识,希望对你有一定的参考价值。

一:History日志聚合的配置

1.介绍

  Spark的日志聚合功能不是standalone模式独享的,是所有运行模式下都会存在的情况

  默认情况下历史日志是保存到tmp文件夹中的

  

2.参考官网的知识点位置

  

 

3.修改spark-defaults.conf

  

 

4.修改env.sh

  

 

5.在HDFS上新建/spark-history

  bin/hdfs dfs -mkdir /spark-history

 

6.启动历史服务

  sbin/start-history-server.sh

  

 

7.测试  

  webUI: http://192.168.187.146:18080/
  local模式:bin/spark-shell
  standalone模式:bin/spark-shell --master spark://linux-hadoop3.ibeifeng.com:7070

 

8.local模式的测试

  bin/spark-shell

  然后输入程序。

  在

  

 

9.standalone模式

  bin/spark-shell --master spark://linux-hadoop3.ibeifeng.com:7070

  输入程序

  

 

二:RestApi

  返回应用程序的执行结果。

1.关于RestApi的官网

  也是属于monitor的部分

  

2.介绍

  专门用于获取历史应用的执行结果

  用法: http://<server-url>:18080/api/v1

 

3.使用

  http://linux-hadoop3.ibeifeng.com:18080/api/v1/applications

  

4.进一步使用

  http://linux-hadoop3.ibeifeng.com:18080/api/v1/applications/app-20170206042834-0000/jobs

  

 

  

 

以上是关于Spark中的日志聚合的配置的主要内容,如果未能解决你的问题,请参考以下文章

Spark核心编程进阶-yarn模式下日志查看详解

Flink配置Yarn日志聚合配置历史日志。

Spark设置日志级别

Spark2x on yarn日志配置详解

Yarn聚合日志, 过期清除配置不生效

Yarn application开启日志聚合,并配置存储路径和周期