EC2 作业流失败

Posted

技术标签:

【中文标题】EC2 作业流失败【英文标题】:EC2 Job Flow Failure 【发布时间】:2011-10-18 16:50:24 【问题描述】:

我有一个要在 s3 上运行的 jar 文件 MapReduce。它需要两个参数,一个输入目录和一个输出文件。

所以我使用 elastic-mapreduce ruby​​ 命令行工具尝试了以下命令:

elastic-mapreduce -j j-JOBFLOW --jar s3n://this.bucket.com/jars/this.jar --arg s3n://this.bucket.com/data/ --arg s3n://this.bucket.com/output/this.csv

这失败了,错误

线程“主”java.lang.ClassNotFoundException 中的异常:s3n://this/bucket/com/data/

所以我在各自的 args 之后使用 --input 和 --output 进行了尝试。这也失败了,因为找不到 --input 类的错误(似乎它无法破译 --input 而不是它无法破译输入后的参数)

这似乎是一个基本的事情,但我无法让它发挥作用。任何帮助深表感谢。谢谢。

【问题讨论】:

【参考方案1】:

试试:

elastic-mapreduce --create --jar s3n://this.bucket.com/jars/this.jar --args "s3n://this.bucket.com/data/,s3n://this.bucket.com/output/this.csv"

仔细检查你的jar,输入数据在那里:

s3cmd ls s3://this.bucket.com/data/

【讨论】:

以上是关于EC2 作业流失败的主要内容,如果未能解决你的问题,请参考以下文章

错误:流式传输作业失败:流分析作业存在验证错误:当前不支持到端点的多个输入列

使用 Azure Function 作为流分析的输出:连接测试失败

Terraform Azure 流分析作业 - 开始/停止

错误代码:从 Azure 流分析作业中采样数据时出现 BadArgument 错误消息

将 AWS Glue 作业迁移到 EC2

Spark 流式传输作业在被驱动程序停止后失败