mapreduce 的map输出文件在哪
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了mapreduce 的map输出文件在哪相关的知识,希望对你有一定的参考价值。
map任务的输出结果不写入HDFS,而是写入执行map的本地硬盘上,为什么呢?因为map的输出是中间结果,所谓中间结果,就是要经过reduce之后才会是最终结果,而且整个mapreduce执行完之后,这个结果就要被干掉了。所以,把它放在HDFS中并实现备份,这就有点大题小做了。当你执行mapreduce的时候,你可以在shell中用命令 df -lh 来查看硬盘的使用率,要想办法把这个使用率控制在90%以内。 参考技术A 在旧版mapred下面实现方法如下:// 获得输入文件的路径名
String path=((FileSplit)reporter.getInputSplit()).getPath().toString();
//使用Reporter reporter对象来获取,在新版mapreduce中.本回答被提问者采纳
以上是关于mapreduce 的map输出文件在哪的主要内容,如果未能解决你的问题,请参考以下文章
Apache Hadoop YARN 中的“mapreduce.map.memory.mb”和“mapred.map.child.java.opts”之间有啥关系?
Hadoop三句话告诉你 mapreduce 中MAP进程的数量怎么控制?