Apache Crunch 管道如何生成 map reduce 作业?

Posted

技术标签:

【中文标题】Apache Crunch 管道如何生成 map reduce 作业?【英文标题】:How does Apache Crunch pipeline generate map reduce jobs? 【发布时间】:2015-10-06 01:06:50 【问题描述】:

我不熟悉诸如 Crunch/Cascading 之类的 hadoop 管道框架。我想知道在这些框架的底部,它们是否会生成原始的映射器和减速器类,就像原始的 MapReduce 程序一样?从 Crunch 源代码中,我没有找到将管道转换为原始 MapReduce 类的代码。

【问题讨论】:

【参考方案1】:

您可以使用代码中的以下行来可视化 MapReduce 计划 crunch 创建的。将 pipeline.dot 中创建的 DOT 代码复制到 graphviz 以查看计划。

String dot = pipeline.getConfiguration().get("crunch.planner.dotfile");
Files.write(dot, new File("pipeline.dot"), Charsets.UTF_8);

【讨论】:

以上是关于Apache Crunch 管道如何生成 map reduce 作业?的主要内容,如果未能解决你的问题,请参考以下文章

crunch字典生成

crunch生成的使用

Apache Spark:在 map reduce 管道中获取执行者 ID

linux字典生成工具crunch

kali crunch生成指定文件大小

Kali字典生成工具---crunch