Mapreduce程序运行的多模式
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Mapreduce程序运行的多模式相关的知识,希望对你有一定的参考价值。
Mapreduce程序可在多种模式下运行:
- 本地模式:
1) 本地文件,本地处理:将MR的输入输出路径设置为本地路径;
2) 集群文件,本地处理:将MR的输入输出设置为HDFS的路径,job在本地进行处理;
2.集群模式:集群文件,集群处理:将MR的输入输出设置为HDFS的路径,并将Job提交到集群里面(Yarn)处理;其中以集群模式运行的时候还可通过以下几种方式对Job作业进行提交(前提是在集群里面已经启动HDFS以及Yarn):
1) 在Eclipse提交:
a) 在安装有hadoop相应版本的eclipse开发Mapreduce程序的hadoop插件,在运行时可直接右键选择run in Hadoop
b) 若未安装插件,可在Mapreduce项目下导入hadoop里面配置好的配置文件Mapreduce-site.xml,yarn-site.xml同时在程序入口处用Configuration指明配置:
conf.set(“mapreduce.job.jar”,”xxx.jar”),若不想导入这两个文件则需多加几个配置语句conf.set(“mapreduce.framework.name”,”yarn”)···等等配置文件里面的配置项。
2) 通过命令行提交:在eclipse下打成jar包之后丢进集群环境:hadoop jar xxx.jar xxxx(打jar前的主类,需写明所在包和类) 【需设参数的话此处可设置参数】
以上是关于Mapreduce程序运行的多模式的主要内容,如果未能解决你的问题,请参考以下文章
2021年大数据Hadoop(十八):MapReduce程序运行模式和深入解析
如何在Windows下面运行hadoop的MapReduce程序
如何在Windows下面运行hadoop的MapReduce程序
如何在Windows下面运行hadoop的MapReduce程序