hadoop的参数调优

Posted 大数据码农

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了hadoop的参数调优相关的知识,希望对你有一定的参考价值。

1,在hdfs-site.xml 中配置多目录,提前配置好,以免以后要配置时,需要重启集群。

2,namenode 有一个工作线程池,用来处理不同的datanode的并发心跳和客户端访问并发请求。配置dfs.namenode.handler.count=20 * log2(Cluster Size),比如集群为10台,可以设置为60。

3,把编辑日志存储路径和镜像文件存储路径分开,达到最低写入延迟。

4,可以调整NM最大的物理内存量,默认8G,可以调大;如果你的物理内存不足8G,则需要调小,因为NM不会探测你的物理内存。

5,可以调大单个任务获取的最大内存,默认8G,可以调大。

以上是关于hadoop的参数调优的主要内容,如果未能解决你的问题,请参考以下文章

hadoop常用的调优参数

Hadoop-Yarn常用的调优参数

Hadoop-Yarn常用的调优参数

Hadoop参数调优

hadoop的参数调优

一网打尽HDFSMapReduceYarn实战参数调优