spark执行在yarn上executor内存不足异常ERROR YarnScheduler: Lost executor 542 on host-bigdata3: Container marked

Posted xjh713

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了spark执行在yarn上executor内存不足异常ERROR YarnScheduler: Lost executor 542 on host-bigdata3: Container marked相关的知识,希望对你有一定的参考价值。

 

当spark跑在yarn上时 单个executor执行时,数据量过大时会导致executor的memory不足而使得rdd  最后lost,最终导致任务执行失败

 

其中会抛出如图异常信息

技术图片

 

如图中异常所示

 

对应解决方法可以加上对应的参数调优(这个配置可以在总的处理数据量在几百TB或者1~3PB级别的数据处理时解决executor-memory不足问题)

 --num-executors=512 --executor-cores=8 --executor-memory=32g --driver-memory=16g --driver-cores=8g --shuffle_partitions=4000 

 

以上设置的相关数值,可以根据实际集群大小适当调整;但是如果遇到类似异常问题大多就是调整这几个参数就可以解决

 

以上是关于spark执行在yarn上executor内存不足异常ERROR YarnScheduler: Lost executor 542 on host-bigdata3: Container marked的主要内容,如果未能解决你的问题,请参考以下文章

YARN 上 Spark 应用程序的物理内存使用量不断增加

Spark运行内存溢出--->spark.yarn.executor.memoryOverhead

Spark+yarn - 使用输入大小缩放内存

Spark on Yarn 为啥出现内存超界container被kill

Spark on Yarn提交配置没有生效

spark 内存管理