Yarn 显示作业已成功,但 EMR 显示该步骤仍在运行

Posted

技术标签:

【中文标题】Yarn 显示作业已成功,但 EMR 显示该步骤仍在运行【英文标题】:Yarn shows the jobs is succeeded but the EMR shows the step is still running 【发布时间】:2018-02-11 09:57:28 【问题描述】:

Yarn 显示作业已成功(在 Yarn UI 中),但 EMR 显示该步骤(在 EMR 控制台 UI 中)仍在运行,并且永远显示为 tat。任何想法 ? 我正在将 s3 作为 json 部分文件写入,我在驱动程序日志中看到了这一点:

Caused by: java.io.IOException: File already exists:s3n:

但驱动程序仍在运行,但纱线显示成功。

【问题讨论】:

【参考方案1】:

我遇到了同样的问题,s3 告诉我文件已经存在并且工作正在按预期完成。首先,不要使用s3n://,而是使用s3://,按照this issue 中的建议。

为了摆脱IOException,我启用了EMRFS consistent view,推荐用于“使用Amazon S3 作为数据存储运行快速、连续步骤的集群”,这就是我的情况。 YMMV。

【讨论】:

以上是关于Yarn 显示作业已成功,但 EMR 显示该步骤仍在运行的主要内容,如果未能解决你的问题,请参考以下文章

Flutter Web 的问题。 Chrome Beta 已卸载但仍显示

Zeppelin 坚持在 YARN 工作

AWS EMR 文件已存在:Hadoop 作业读取和写入 S3

使用 MRJob 将作业提交到 EMR 集群

如何设置 Zeppelin 以使用远程 EMR Yarn 集群

Pentaho 中止选项不起作用