在 HDIinsight 集群上运行 spark 作业时如何解决此致命错误?会话 681 意外地达到了“死亡”的最终状态。查看日志:
Posted
技术标签:
【中文标题】在 HDIinsight 集群上运行 spark 作业时如何解决此致命错误?会话 681 意外地达到了“死亡”的最终状态。查看日志:【英文标题】:How to fix this fatal error while running spark jobs on HDIinsight cluster? Session 681 unexpectedly reached final status 'dead'. See logs: 【发布时间】:2019-06-21 22:38:18 【问题描述】:我在 HDIcluster 上运行 pyspark 代码并收到此错误:
代码因致命错误而失败:会话 681 意外 达到“死亡”的最终状态。查看日志:
我没有 YARN 或 Hadoop 方面的经验。我尝试了堆栈溢出中提供的几个链接。但他们都没有帮助。一件奇怪的事情是我昨天能够运行相同的代码而没有出现该错误。
我刚刚运行了这个导入
from pyspark.sql import SparkSession
这是我得到的错误:
19/06/21 20:35:35 INFO Client:
client token: N/A
diagnostics: [Fri Jun 21 20:35:35 +0000 2019] Application is Activated, waiting for resources to be assigned for AM. Details : AM Partition = <DEFAULT_PARTITION> ; Partition Resource = <memory:819200, vCores:240> ; Queue's Absolute capacity = 50.0 % ; Queue's Absolute used capacity = 99.1875 % ; Queue's Absolute max capacity = 100.0 % ;
ApplicationMaster host: N/A
ApplicationMaster RPC port: -1
queue: default
start time: 1561149335158
final status: UNDEFINED
tracking URL: https://mmsorderpredhdi.azurehdinsight.net/yarnui/hn/proxy/application_1560840076505_0062/
user: livy
19/06/21 20:35:35 INFO ShutdownHookManager: Shutdown hook called
19/06/21 20:35:35 INFO ShutdownHookManager: Deleting directory /tmp/spark-bb63c5f0-7579-4456-b32a-0e643ca97ecc
YARN Diagnostics:
Application killed by user..
问题:Queue的绝对已用容量有什么要处理的吗?
【问题讨论】:
【参考方案1】:能否请您检查日志以找到确切的问题?
在哪里可以找到日志文件?
在 Azure HDInsight 群集上,您可以通过使用 SSH 连接到其中一个头节点并在此路径下载文件来找到 livy 日志。
hdfs dfs -ls /app-logs/livy/logs-ifile
更多详情请参考“Access Apache Hadoop YARN application logs on Linux-based HDInsight”
另外,您可以参考“How to start sparksession in pyspark”。
希望这会有所帮助。
【讨论】:
以上是关于在 HDIinsight 集群上运行 spark 作业时如何解决此致命错误?会话 681 意外地达到了“死亡”的最终状态。查看日志:的主要内容,如果未能解决你的问题,请参考以下文章
Zeppelin+Spark+Kubernetes:让 Zeppelin Job 在现有的 Spark 集群上运行