搭建Hadoop集群Tips

Posted 啦啦小明

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了搭建Hadoop集群Tips相关的知识,希望对你有一定的参考价值。

6 HDFS安装过程

1)解压安装包

root@master:/usr/local# tar -zxvf hadoop-2.4.0.tar.gz

如果不是使用root用户解压,建议使用chown修改文件夹属性(比如当前用户为xiaoming)

xiaoming@master:/usr/local# sudo chown -R xiaoming:xiaoming hadoop

如果集群是64位操作系统,需要替换lib/native文件夹,否则会出现警告提示

2)修改配置文件

主要涉及的配置文件有7个:

/usr/local/hadoop/etc/hadoop/hadoop-env.sh
/usr/local/hadoop/etc/hadoop/yarn-env.sh
/usr/local/hadoop/etc/hadoop/slaves
/usr/local/hadoop/etc/hadoop/core-site.xml
/usr/local/hadoop/etc/hadoop/hdfs-site.xml
/usr/local/hadoop/etc/hadoop/mapred-site.xml
/usr/local/hadoop/etc/hadoop/yarn-site.xml

分两步安装,首先配置HDFS,然后配置YARN

配置HDFS需要修改文件包括hadoop-env.sh、slaves、core-site.xml和hdfs-site.xml

2.1)修改hadoop-env.sh

在文件底部添加

export JAVA_HOME=/usr/local/java/jdk1.7.0_79

2.2)修改slaves

slaves文件主要是设置从节点的名称

slave1
slave2
slave3
slave4

2.3)修改core-site.xml

参考官网文档在<Configuration></Configuration>中添加设置

  <property>
    <name>fs.defaultFS</name>
    <value>hdfs://master:8020</value>
    <final>true</final>
  </property>
  <property>
    <name>io.file.buffer.size</name>
    <value>131072</value>
  </property>
<property>
<name>hadoop.tmp.dir</name>
<value>/usr/local/hadoop/tmp</value>
</property>
<property>
<name>hadoop.proxyuser.root.hosts</name>
<value>*</value>
</property>
<property>
<name>hadoop.proxyuser.root.groups</name>
<value>*</value>
</property>

2.4)修改hdfs-site.xml

参考官网文档在<Configuration></Configuration>中添加设置

在NameNode中添加

<property>
    <name>dfs.namenode.name.dir</name>
    <value>/usr/local/hadoop/dfs/name</value>
  </property>
  <property>
    <name>dfs.blocksize</name>
    <value>67108864</value>
  </property>
  <property>
    <name>dfs.namenode.handler.count</name>
    <value>100</value>
  </property>
  <property>
    <name>dfs.namenode.hosts</name>
    <value>slave1,slave2,slave3,slave4</value>
  </property>
<property>
<name>dfs.webhdfs.enabled</name>
<value>true</value>
</property>
<property>
<name>dfs.namenode.secondary.http-address</name>
<value>master:9001</value>
</property>

在DataNode中添加

  <property>
    <name>dfs.datanode.data.dir</name>
    <value>/usr/local/hadoop/dfs/data</value>
  </property>

2.5)格式化HDFS

root@master:/usr/local/hadoop# hdfs namenode -format

2.6)启动集群

可以通过~/sbin/start-dfs.sh启动集群,也可以通过hadoop-daemon.sh start datanode单独启动各个节点

root@master:/usr/local/hadoop# start-dfs.sh

NameNode上jps命令

root@master:/usr/local/hadoop/sbin# jps
4760 NameNode
5103 SecondaryNameNode
13518 Jps

DataNode上jps命令

root@slave1:/usr/local/hadoop/sbin# jps
7258 Jps
3042 DataNode

2.7)上传文件

新建两个文本文件

root@master:/usr/local/hadoop# echo "hello world" >> file1
root@master:/usr/local/hadoop# echo "hello hadoop" >> file2

上传到HDFS

root@master:/usr/local/hadoop# hdfs dfs -put file* /

显示文件信息

root@master:/usr/local/hadoop# hdfs dfs -ls /
Found 2 items
-rw-r--r--   3 root supergroup         12 2016-06-02 20:02 /file1
-rw-r--r--   3 root supergroup         13 2016-06-02 20:02 /file2

 

以上是关于搭建Hadoop集群Tips的主要内容,如果未能解决你的问题,请参考以下文章

vmware搭建hadoop集群完整过程笔记

Hadoop集群搭建 Hbase

spark集群安装并集成到hadoop集群

Hadoop集群配置

Hadoop集群搭建,14张过程截图超详细教程

Hadoop集群搭建,14张过程截图超详细教程