Hadoop3.13 配置文件

Posted velome

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Hadoop3.13 配置文件相关的知识,希望对你有一定的参考价值。

首先会写出集群的部署规划,然后根据规划编写对应的配置文件

主要包含四个配置文件,包含的,将配置文件改好,然后分发到各个配置文件然后启动集群的时候将会加载配置文件

一、集群的部署规划

  

 

hadoop102

hadoop103

hadoop104

HDFS

 

NameNode

DataNode

 

DataNode

SecondaryNameNode

DataNode

YARN

 

NodeManager

ResourceManager

NodeManager

 

NodeManager

注意:NameNodeSecondaryNameNode不要安装在同一台服务器,但是中间会涉及到数据的来回拷贝,尽量放置近一点

注意:ResourceManager也很消耗内存,不要和NameNodeSecondaryNameNode配置在同一台机器上。

二、hadoop 中常用的端口

 

Daemon

App

Hadoop2

Hadoop3

NameNode Port

Hadoop HDFS NameNode

8020 / 9000

9820

 

Hadoop HDFS NameNode HTTP UI

50070

9870

Secondary NameNode Port

Secondary NameNode

50091

9869

 

Secondary NameNode HTTP UI

50090

9868

DataNode Port

Hadoop HDFS DataNode IPC

50020

9867

 

Hadoop HDFS DataNode

50010

9866

 

Hadoop HDFS DataNode HTTP UI

50075

9864

 

三、自定义配置文件

 

core-site.xmlhdfs-site.xmlyarn-site.xmlmapred-site.xml四个配置文件存放在$HADOOP_HOME/etc/hadoop这个路径上用户可以根据项目需求重新进行修改配置。

 

一、配置core-site.xml

 1 <?xml version="1.0" encoding="UTF-8"?>
 2 <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
 3 
 4 <configuration>
 5     <!-- 指定NameNode的地址 -->
 6     <property>
 7         <name>fs.defaultFS</name>
 8         <value>hdfs://hadoop102:9820</value>
 9 </property>
10 <!-- 指定hadoop数据的存储目录 -->
11     <property>
12         <name>hadoop.tmp.dir</name>
13         <value>/opt/module/hadoop-3.1.3/data</value>
14 </property>
15 
16 <!-- 配置HDFS网页登录使用的静态用户为atguigu -->
17     <property>
18         <name>hadoop.http.staticuser.user</name>
19         <value>atguigu</value>
20 </property>
21 
22 <!-- 配置该atguigu(superUser)允许通过代理访问的主机节点 -->
23     <property>
24         <name>hadoop.proxyuser.atguigu.hosts</name>
25         <value>*</value>
26 </property>
27 <!-- 配置该atguigu(superUser)允许通过代理用户所属组 -->
28     <property>
29         <name>hadoop.proxyuser.atguigu.groups</name>
30         <value>*</value>
31 </property>
32 <!-- 配置该atguigu(superUser)允许通过代理的用户-->
33     <property>
34         <name>hadoop.proxyuser.atguigu.groups</name>
35         <value>*</value>
36 </property>
37 </configuration>

 

二、配置hdfs-site.xml

 1 <?xml version="1.0" encoding="UTF-8"?>
 2 <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
 3 
 4 <configuration>
 5     <!-- nn web端访问地址-->
 6     <property>
 7         <name>dfs.namenode.http-address</name>
 8         <value>hadoop102:9870</value>
 9     </property>
10     <!-- 2nn web端访问地址-->
11     <property>
12         <name>dfs.namenode.secondary.http-address</name>
13         <value>hadoop104:9868</value>
14     </property>
15 </configuration>

 

三、配置yarn-site.xml

 1 <?xml version="1.0" encoding="UTF-8"?>
 2 <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
 3 
 4 <configuration>
 5     <!-- 指定MR走shuffle -->
 6     <property>
 7         <name>yarn.nodemanager.aux-services</name>
 8         <value>mapreduce_shuffle</value>
 9 </property>
10 <!-- 指定ResourceManager的地址-->
11     <property>
12         <name>yarn.resourcemanager.hostname</name>
13         <value>hadoop103</value>
14 </property>
15 
16 <!-- 开启日志聚集功能 -->
17 <property>
18     <name>yarn.log-aggregation-enable</name>
19     <value>true</value>
20 </property>
21 <!-- 设置日志聚集服务器地址 -->
22 <property>  
23     <name>yarn.log.server.url</name>  
24     <value>http://hadoop102:19888/jobhistory/logs</value>
25 </property>
26 <!-- 设置日志保留时间为7天 -->
27 <property>
28     <name>yarn.log-aggregation.retain-seconds</name>
29     <value>604800</value>
30 </property>
31 
32 
33 <!-- 环境变量的继承 -->
34     <property>
35         <name>yarn.nodemanager.env-whitelist</name>
36         <value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME</value>
37 </property>
38 <!-- yarn容器允许分配的最大最小内存 -->
39     <property>
40         <name>yarn.scheduler.minimum-allocation-mb</name>
41         <value>512</value>
42     </property>
43     <property>
44         <name>yarn.scheduler.maximum-allocation-mb</name>
45         <value>4096</value>
46 </property>
47 <!-- yarn容器允许管理的物理内存大小 -->
48     <property>
49         <name>yarn.nodemanager.resource.memory-mb</name>
50         <value>4096</value>
51 </property>
52 <!-- 关闭yarn对物理内存和虚拟内存的限制检查 -->
53     <property>
54         <name>yarn.nodemanager.pmem-check-enabled</name>
55         <value>false</value>
56     </property>
57     <property>
58         <name>yarn.nodemanager.vmem-check-enabled</name>
59         <value>false</value>
60     </property>
61 </configuration>

 

 

四、MapReduce配置文件

 

 1 <?xml version="1.0" encoding="UTF-8"?>
 2 <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
 3 
 4 <configuration>
 5     <!-- 指定MapReduce程序运行在Yarn上 -->
 6     <property>
 7         <name>mapreduce.framework.name</name>
 8         <value>yarn</value>
 9     </property>
10     
11     <!-- 历史服务器端地址 -->
12     <property>
13         <name>mapreduce.jobhistory.address</name>
14         <value>hadoop102:10020</value>
15     </property>
16 
17     <!-- 历史服务器web端地址 -->
18     <property>
19         <name>mapreduce.jobhistory.webapp.address</name>
20         <value>hadoop102:19888</value>
21     </property>
22 
23 </configuration>

 

 

5、配置workers

此文件主要为指定dn有哪些,这配置如下  

1 hadoop102
2 hadoop103
3 hadoop104

配置文件写好后,需要分发给各个节点,并且一定要对nn进行格式化操作,不然后面nn的进程启动不起来

 

以上是关于Hadoop3.13 配置文件的主要内容,如果未能解决你的问题,请参考以下文章

VSCode自定义代码片段11——vue路由的配置

VSCode自定义代码片段11——vue路由的配置

VS Code配置markdown代码片段

VS Code配置markdown代码片段

VS Code配置snippets代码片段快速生成html模板,提高前端编写效率

如何为 XSLT 代码片段配置 CruiseControl 的 C# 版本?