使用自定义 spark 版本启动 Oozie 作业

Posted

技术标签:

【中文标题】使用自定义 spark 版本启动 Oozie 作业【英文标题】:Launch Oozie job with custom spark version 【发布时间】:2018-07-24 14:29:00 【问题描述】:

我正在尝试通过 oozie 在我的 HDP 2.6.1 集群上运行 Spark 作业。最初安装的 Spark 版本是 1.6.1 和 2.1.1。我通过 sharelibupdate 添加了 2.3.0 预构建包(Hadoop 2.7 及更高版本)版本(通过创建一个目录,在其中我复制了所有 spark 2.3.0 jar + Oozie jar)但我面临这个错误:..././assembly/target/scala-2.11/jars' does not exist; make sure Spark is built.

我在 Spark 集群模式下运行 Spark。

有人遇到过这个问题吗?甚至可以添加这样的火花版本吗?

【问题讨论】:

【参考方案1】:

我找到了解决方案。它与this Oozie 已知问题有关。我只需添加一个带有 spark 2.3.0 jar 路径的 spark 属性 spark.yarn.jars

【讨论】:

以上是关于使用自定义 spark 版本启动 Oozie 作业的主要内容,如果未能解决你的问题,请参考以下文章

使用火花动作在 Oozie 中的 python Spark 作业

Oozie coordinator 作业自定义的配置的一些方法

Oozie Spark (2.x) 动作总是卡在接受状态

spark作业和hive脚本自动化

OOzie 中 PySpark 作业的主类

如何使用spark streaming接收kafka中发送的自定义对象