mapreduce 的map输出文件在哪

Posted 2023-03-08

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了mapreduce 的map输出文件在哪相关的知识，希望对你有一定的参考价值。

map任务的输出结果不写入HDFS，而是写入执行map的本地硬盘上，为什么呢？因为map的输出是中间结果，所谓中间结果，就是要经过reduce之后才会是最终结果，而且整个mapreduce执行完之后，这个结果就要被干掉了。所以，把它放在HDFS中并实现备份，这就有点大题小做了。当你执行mapreduce的时候，你可以在shell中用命令 df -lh 来查看硬盘的使用率，要想办法把这个使用率控制在90%以内。参考技术A 在旧版mapred下面实现方法如下：
// 获得输入文件的路径名
String path=((FileSplit)reporter.getInputSplit()).getPath().toString();
//使用Reporter reporter对象来获取，在新版mapreduce中.本回答被提问者采纳

以上是关于mapreduce 的map输出文件在哪的主要内容，如果未能解决你的问题，请参考以下文章

Apache Hadoop YARN 中的“mapreduce.map.memory.mb”和“mapred.map.child.java.opts”之间有啥关系？

MapR 和 Map Reduce 有啥区别？

Hadoop三句话告诉你 mapreduce 中MAP进程的数量怎么控制？

mr中间结果优化

如何在 hadoop mapreduce 中进行 lzo 压缩？

hadoop.mapred vs hadoop.mapreduce？