如何解决 java.lang.OutOfMemoryError: Java heap space when train word2vec model in Spark?

Posted

技术标签:

【中文标题】如何解决 java.lang.OutOfMemoryError: Java heap space when train word2vec model in Spark?【英文标题】:how to solve java.lang.OutOfMemoryError: Java heap space when train word2vec model in Spark? 【发布时间】:2015-12-14 08:53:30 【问题描述】:

Solu:我把参数 driver-memory 40G 放在 spark-submit 中。


问题:我的 Spark 集群由 5 个 ubuntu 服务器组成,每个服务器有 80G 内存和 24 个内核。 word2vec 大约是 10G 的新闻数据。 我以这样的独立模式提交作业:

spark-submit --name trainNewsdata --class Word2Vec.trainNewsData --master spark://master:7077 --executor-memory 70G --total-executor-cores 96 sogou.jar hdfs://master:9000 /user/bd/newsdata/* hdfs://master:9000/user/bd/word2vecModel_newsdata

当我在 spark 中训练 word2vec 模型时,我发生了: 线程“主”java.lang.OutOfMemoryError 中的异常:Java 堆空间, 我不知道如何解决它,请帮助我:)

【问题讨论】:

Spark java.lang.OutOfMemoryError: Java heap space的可能重复 可能和那个不一样 您没有足够的详细信息来确定它可能有所不同。尝试链接问题中的诊断和解决方案,然后说出它的不同之处。 “它可能不同”在这一点上与“它可能是宇宙射线”一样有用。 好的,我可能知道了,我把参数 driver-memory 40G 放在 spark-submit 中。 【参考方案1】:

我把params driver-memory 40G放到spark-submit中,然后解决。

【讨论】:

以上是关于如何解决 java.lang.OutOfMemoryError: Java heap space when train word2vec model in Spark?的主要内容,如果未能解决你的问题,请参考以下文章

云原生景观:可观察性和分析解决了什么问题?如何解决的?

如何解决 Ajax 跨域请求不到的问题

如何解决包冲突问题

如何解决包冲突问题

如何解决ajax跨域问题

MySQL 的 10048问题,如何解决?