Hadoop JvmPauseMonitor
Posted
技术标签:
【中文标题】Hadoop JvmPauseMonitor【英文标题】: 【发布时间】:2016-08-04 19:34:02 【问题描述】:最近遇到有趣的 Cloudera Hadoop 和 HDFS 场景,我们无法启动 NameNode 服务。
尝试重启 HDFS 服务时,我们无法成功重启集群中的 NameNode 服务。在查看日志后,我们没有观察到任何错误,但确实看到了一些与 JvmPauseMonitor
相关的条目...
org.apache.hadoop.util.JvmPauseMonitor:在 JVM 或主机(例如 GC)中检测到暂停:暂停大约 5015 毫秒
我们在/var/log/hadoop-hdfs/NAMENODE.log.out
中观察到这些条目,没有看到任何其他错误,包括/var/log/messages
。
【问题讨论】:
【参考方案1】:检查您的 JAVA 堆大小
最终,我们能够确定我们遇到了未记录的 Java OOM 异常。
从性能的角度来看,作为 HDFS 中每 100 万块的一般规则,您应该配置至少 1GB 的 Java 堆大小。
在我们的例子中,解决方法很简单,只需要增加 NameNode 和辅助 NameNode 服务的 Java 堆大小并重新启动......因为我们已经增长到 150 万块,但只使用 Java 堆的默认 1GB 设置尺寸。
在将 Java Heap Size 增加到至少 2GB 并重新启动 HDFS 服务后,我们完全是绿色的。
干杯!
【讨论】:
以上是关于Hadoop JvmPauseMonitor的主要内容,如果未能解决你的问题,请参考以下文章