MapReduce历史服务器

Posted QZhen

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了MapReduce历史服务器相关的知识,希望对你有一定的参考价值。

作用

保存执行job任务节点的执行日志

将多个节点执行map任务的日志和最终reduce日志聚合在一起

 

在mapred-site.xml中添加配置

技术图片
1 <property>
2     <name>mapreduce.jobhistory.address</name>
3     <value>hostname:10020</value>
4  </property>
5 <property>
6     <name>mapreduce.jobhistory.webapp.address</name>
7     <value>hostname:19888</value>
8  </property>
View Code

在yarn-site.xml中天价配置

技术图片
1 <property>
2     <name>yarn.log-aggregation-enable</name>
3     <value>true</value>
4  </property>
5 <property>
6     <name>yarn.log-aggregation.retain-seconds</name> #日志保存时间
7     <value>604800</value> #默认7天
8  </property>
View Code

 启动历史服务器

mr-jobhistory-daemon.sh start historyserver

必须在yarn集群启动之前启动历史服务器才能够记录日志。

以上是关于MapReduce历史服务器的主要内容,如果未能解决你的问题,请参考以下文章

2021年大数据Hadoop(二十四):MapReduce高阶训练

hadoop历史服务的启动与停止

2021年大数据Hadoop(十七):MapReduce编程规范及示例编写

2021年大数据Hadoop(十九):​​​​​​​MapReduce分区

hadoop的mapreduce常见算法案例有几种

2021年大数据Hadoop(二十三):MapReduce的运行机制详解