mapreduce 的map输出文件在哪

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了mapreduce 的map输出文件在哪相关的知识,希望对你有一定的参考价值。

map任务的输出结果不写入HDFS,而是写入执行map的本地硬盘上,为什么呢?因为map的输出是中间结果,所谓中间结果,就是要经过reduce之后才会是最终结果,而且整个mapreduce执行完之后,这个结果就要被干掉了。所以,把它放在HDFS中并实现备份,这就有点大题小做了。当你执行mapreduce的时候,你可以在shell中用命令 df -lh 来查看硬盘的使用率,要想办法把这个使用率控制在90%以内。 参考技术A 在旧版mapred下面实现方法如下:
// 获得输入文件的路径名
String path=((FileSplit)reporter.getInputSplit()).getPath().toString();
//使用Reporter reporter对象来获取,在新版mapreduce中.本回答被提问者采纳

以上是关于mapreduce 的map输出文件在哪的主要内容,如果未能解决你的问题,请参考以下文章

Apache Hadoop YARN 中的“mapreduce.map.memory.mb”和“mapred.map.child.java.opts”之间有啥关系?

MapR 和 Map Reduce 有啥区别?

Hadoop三句话告诉你 mapreduce 中MAP进程的数量怎么控制?

mr中间结果优化

如何在 hadoop mapreduce 中进行 lzo 压缩?

hadoop.mapred vs hadoop.mapreduce?