使用亚马逊弹性mapreduce服务时如何在hadoop中包含第三方库

Posted

技术标签:

【中文标题】使用亚马逊弹性mapreduce服务时如何在hadoop中包含第三方库【英文标题】:How to include third party library in hadoop when Using amazon elastic mapreduce service 【发布时间】:2012-10-24 23:02:40 【问题描述】:

我必须使用名为 weka 的第三方库执行一些数据挖掘任务。但我不确定如何在亚马逊弹性 mapreduce 服务中包含所需的 jar 文件。

有没有人处理这个案子的经验?

【问题讨论】:

【参考方案1】:

一个简单的解决方案是将您的依赖项与映射器和缩减器一起放入您的 jar 文件中。 如果您使用 Maven 构建,我建议使用 Maven Assembly Plugin 插件来打包一个包含所有依赖项的 jar。

【讨论】:

以上是关于使用亚马逊弹性mapreduce服务时如何在hadoop中包含第三方库的主要内容,如果未能解决你的问题,请参考以下文章

亚马逊如何拥有弹性 IP 的专有权

如何使用弹性 beantalk 加密负载均衡器和 Web 服务器之间的流量

为啥从亚马逊弹性负载均衡器后面发送重定向时收到 502 错误网关?

如何使用正则表达式在 url 中捕获 ec2 弹性 ip 模式 [重复]

使用亚马逊云科技的SQS服务有啥优势?

如何在亚马逊弹性豆茎上强制 https 而不会失败健康检查 [重复]