十二道MR习题 - 2 - 多文件保存

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了十二道MR习题 - 2 - 多文件保存相关的知识,希望对你有一定的参考价值。

题目:

需要将MR的执行结果保存到3个文件中,该怎么做。

又是一个送分题。

对于Hadoop的MapReduce来说只需要设置一下reduce任务的数量即可。MR的Job默认reduce数量是1,需要调用job的setNumReduceTasks()方法来调整reduce任务的数量。

对于spark来说,可以调用coalesce方法或repartition方法来调整分区的数量,这样也可以调整最终结果输出文件的数量。关于coalesce方法和分区的关系这里不展开了,随便搜搜就能找到了。

#######

以上是关于十二道MR习题 - 2 - 多文件保存的主要内容,如果未能解决你的问题,请参考以下文章

十二道MR习题 - 4 - TopN问题

十二道MR习题 – 1 – 排序

python练习题1优化:用户信息保存到文件

Python的十二道编程题,码住战胜一切

第二天习题

Linux练习题-重定义