CentOS7下Hadoop Single Node Cluster的安装

Posted lone5wolf

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了CentOS7下Hadoop Single Node Cluster的安装相关的知识,希望对你有一定的参考价值。

一、安装JDK,并配置环境变量。因为Hadoop是以Java开发的,所以必须先安装Java环境
二、安装SSH,设置SSH无密码登录。Hadoop是由很多台服务器所组成的。当我们启动Hadoop系统时,NameNode必须与DataNode连接,并管理这些节点(DataNode)。此时系统会要求用户输入密码。为了让系统顺利运行而不需手动输入密码,就需要SSH设置成无密码登录。
   注意:无密码登录登录并非不需要密码,而是以事先交换SSH Key(密钥)的方式来进行身份验证
 1、安装SSH:CentOS 7 已经安装
 2、安装rsync:CentOS 7 已经安装
 3、产生SSH Key(密钥)进行后续身份验证:
           ssh-keygen  -t  dsa  -P  ‘‘  -f  ~/.ssh/id_dsa
 4、查看产生的SSH Key(密钥):
             ll  ~/.ssh
 5、将产生的Key放置到许可证文件中
            cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys


三、下载安装Hadoop
    1、下载Hadoop-2.8.5.tar.gz并解压
     2、设置Hadoop环境变量:
                    sudo  gedit  ~/.bashrc
       输入以下内容:
          #配置JDK安装路径
               export JAVA_HOME=/usr/local/software/jdk1.8.0_211
         #配置hadoop_home的安装路径
                export HADOOP_HOME=/usr/local/software/hadoop
        #配置PATH
                export PATH=$PATH:$HADOOP_HOME/bin
                export PATH=$PATH:$HADOOP_HOME/sbin

          #设置hadoop其他环境变量
               export HADOOP_MAPRED_HOME=$HADOOP_HOME
               export HADOOP_COMMON_HOME=$HADOOP_HOME
               export HADOOP_HDFS_HOME=$HADOOP_HOME
               export YARN_HOME=$HADOOP_HOME
         #链接库的相关设置
             export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
             export HADOOP_OPTS="-DJava.library.path=$HADOOP_HOME/lib"
             export JAVA_LIBRARY_PATH=$HADOOP_HOME/lib/native:$JAVA_LIBRARY_PATH
 
       3、让~/.bashrc设置生效:
                   source  ~/.bashrc
      4、修改Hadoop配置设置文件:
       (1)在hadoop-2.8.5/etc/hadoop文件夹下的配置文件hadoop-env.sh中修改JAVA_HOME设置
               export JAVA_HOME=/usr/local/software/jdk1.8.0_211
        (2)在hadoop-2.8.5/etc/hadoop文件夹下设置core-site.xml:加入HDFS的默认名称
            <configuration>
                <property>
                      <name>fs.default.name</name>
                     <value>hdfs://localhost:9000</value>
               </property>
           </configuration>       
        (3)  在hadoop-2.8.5/etc/hadoop文件夹下设置yarn-site.xml:
             <configuration>
                <property>
                    <name>yarn.nodemanager.aux-services</name>
                    <value>mapreduce_shuffle</value>
              </property>
              <property>
                 <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
                 <value>org.apache.hadoop.mapred.ShuffleHandler</value>
             </property>
        </configuration>
       (4)在hadoop-2.8.5/etc/hadoop文件夹下设置mapred-site.xml:
             A、复制模板文件:由mapred-site.xml.template 到 mapred-site.xml
             B、在mapred-site.xml设置mapreduce框架为yarn
                    <configuration>
                        <property>
                               <name>mapreduce.framework.name</name>
                               <value>yarn</value>
                        </property>
                   </configuration>  
        (5)在hadoop-2.8.5文件夹下创建hadoop_data文件夹,然后在 hadoop_data下创建hdfs文件夹,最后在hdfs文件夹下分别创建namenode和datanode文件夹     
        (6)在hadoop-2.8.5/etc/hadoop文件夹下设置hdfs-site.xml:设置HDFS分布式文件系统
            <configuration>
               <property>
                   <name>dfs.replication</name>
                   <value>3</value>
               </property>
               <property>
                   <name>dfs.namenode.name.dir</name>
                   <value>
                       file:/usr/local/software/hadoop/hadoop_data/hdfs/namenode
                    </value>
              </property>
              <property>
                   <name>dfs.datanode.data.dir</name>
                   <value>
                           file:/usr/local/software/hadoop/hadoop_data/hdfs/datanode
                    </value>
                 </property>
             </configuration>
      5、将HDFS进行格式化:
                   hadoop  namenode  -format             
      6、将Hadoop目录的所有者更改为hduser(名字可变),因为Linux是多人多任务的操作系统,所有的目录或文件都具有所有者。使用chown可以将目录或文件的所有者更改为hduser
                  chown hduser:hduser -R /usr/local/software/hadoop


     四、启动Hadoop(两种方式):
        (1)分别启动HDFS、YARN
                     start-dfs.sh          ------→启动HDFS
                    start-yarn.sh         ------->启动YARN
        (2)同时启动HDFS、YARN
                     start-all.sh


     五、查看NameNode、DataNode进程是否启动
                   jps
      结果为:
             技术图片
        因为只有一台服务器,所以所有的功能都集中在一台服务器中

     六、打开Hadoop Resource-Manager Web界面(浏览器地址栏输入:http://localhost:8088/)

       技术图片
         Hadoop安装配置成功!

以上是关于CentOS7下Hadoop Single Node Cluster的安装的主要内容,如果未能解决你的问题,请参考以下文章

CentOS7 下 Hadoop 分布式部署

Hadoop Single Node Cluster——Hadoop单节点集群的安装

CentOS7.4下部署hadoop3.1.1

centos7下hadoop3.0搭建文档

centos7下hadoop3.0搭建文档

Centos7下搭建Hadoop2.6完全分布式环境