转载Hadoop 2.7.3 和Hbase 1.2.4安装教程

Posted 大数据与人工智能探索

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了转载Hadoop 2.7.3 和Hbase 1.2.4安装教程相关的知识,希望对你有一定的参考价值。

转载地址:http://blog.csdn.net/napoay/article/details/54136398 

 


目录(?)[+]

 

一、机器环境

  • 系统:MAC OS
  • Hadoop:2.7.3
  • Hbase:1.2.4
  • JDK: 1.8.0_112

二、配置SSH免密码登录

第一步:打开terminal,进入根目录,运行命令:

            cd
  • 1
  • 1

第二步: 显示隐藏文件,这时还没有.ssh文件夹

        ls –a
  • 1
  • 1

第三步:生成密钥

    ssh-keygen -t rsa -P ""
  • 1
  • 1

技术分享 
第四步,进入.ssh文件夹,运行:

cat id_rsa.pub >> authorized_keys
  • 1
  • 1

第五步: ssh登录

ssh localhost
  • 1
  • 1

技术分享

三、安装Hadoop 2.7.3

3.1下载Hadoop

Hadoop下载地址:http://hadoop.apache.org/releases.html 
下载hadoop-2.7.3.tar.gz,大约204MB。 
下载后解压缩:

sudo tar –zxvf hadoop-2.7.3.tar.gz
  • 1
  • 1

Hadoop有三种安装模式:单机模式、伪分布式模式、分布式模式。

3.2运行Hadoop单机模式

解压安装文件之后,就是单机模式,运行wordcount测试是否安装成功。 
第一步:在hadoop-2.7.3目录下新建input文件夹。

sudo mkdir input
  • 1
  • 1

第二步:在input文件夹下新增2个文本文件用于测试。

 echo ‘hello world‘ > file1.txt
 echo ‘hello hadoop‘ > file2.txt
  • 1
  • 2
  • 1
  • 2

第三步:运行wordcount例子

sudo ./bin/hadoop jar ./share/hadoop/mapreduce/hadoop-   
mapreduce-examples-2.7.3.jar wordcount input/ output
  • 1
  • 2
  • 1
  • 2

技术分享 
No news is good news,没waring、没error就说明正确运行。 
第四步:查看运行结果:

cat output/part-r-00000
  • 1
  • 1

统计结果:

hadoop  1
hello   2
world   1
  • 1
  • 2
  • 3
  • 1
  • 2
  • 3

技术分享

3.3 Hadoop伪分布式模式

3.3.1修改hadoop-env.sh

文件位置: hadoop-2.7.3/etc/hadoop/hadoop-env.sh

注释掉 HADOOP_OPTS
#export HADOOP_OPTS="$HADOOP_OPTS -Djava.net.preferIPv4Stack=true"
  • 1
  • 1

改为:

export HADOOP_OPTS="$HADOOP_OPTS -Djava.net.preferIPv4Stack=true -Djava.security.krb5.realm= -Djava.security.krb5.kdc="
  • 1
  • 1

3.3.2修改core-site.xml

文件位置: hadoop-2.7.3/etc/hadoop/core-site.xml 
修改为如下配置:

<configuration>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/usr/local/Cellar/hadoop-2.7.3/hdfs/tmp</value>
        <description>A base for other temporary directories</description>
    </property>
    <property>
        <name>fs.default.name</name>
        <value>hdfs://localhost:9000</value>
    </property>
</configuration>
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11

其中/Users/bee/Documents/bd/hadoop-2.7.3/hdfs/tmp可以自定义. fs.default.name 保存了NameNode的位置,HDFS和MapReduce组件都需要用到它,这就是它出现在core-site.xml 文件中而不是 hdfs-site.xml文件中的原因。

3.3.3修改mapred-site.xml.template

<configuration>
     <property>
        <name>mapred.job.tracker</name>
        <value>localhost:9010</value>
    </property>
</configuration>
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6

变量mapred.job.tracker 保存了JobTracker的位置,因为只有MapReduce组件需要知道这个位置,所以它出现在mapred-site.xml文件中。

3.3.4修改hdfs-site.xml

变量dfs.replication指定了每个HDFS数据库的复制次数。 通常为3, 由于我们只有一台主机和一个伪分布式模式的DataNode,将此值修改为1。
<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
</configuration>
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6

3.4启动hadoop

3.4.1格式化hdfs

./bin/hadoop namenode -format
  • 1
  • 1

技术分享

3.4.2启动Hadoop

运行启动命令:

./sbin/start-all.sh
  • 1
  • 2
  • 1
  • 2

查看进程:

jps
  • 1
  • 1

启动成功之后可以看到NodeManager、NameNode、SecondaryNameNode、ResourceManager这几个进程。

2338 NodeManager
2389 Jps
1900 NameNode
2108 SecondaryNameNode
2238 ResourceManager
  • 1
  • 2
  • 3
  • 4
  • 5
  • 1
  • 2
  • 3
  • 4
  • 5

技术分享

访问HDFS的web端口: http://localhost:50070 
技术分享

四、安装Hbase 1.2.4

4.1 Hbase下载

http://hbase.apache.org/ 
下载后解压缩。

4.2 单机运行

查看Hbase版本:

 ./bin/hbase version
  • 1
  • 1

技术分享

启动Hbase:

./bin/start-hbase.sh
  • 1
  • 1

技术分享 
进入Hbase shell:

 ./bin/hbase shell
  • 1
  • 1

技术分享

4.3伪分布式运行

4.3.1 第一步:修改hbase-env.sh

文件位置: hbase-1.2.4/conf/hbase-env.sh
开启HBASE_MANAGES_ZK,改值默认是注释的,作用是:使用自带的ZooKeeper。我们为了方便,使用Hbase自带的ZooKeeper:
    export HBASE_MANAGES_ZK=true
  • 1
  • 1

4.3.2 第二步:修改hbase-site.xml

<property>
        <name>hbase.rootdir</name>
        <value>hdfs://localhost:9000/hbase</value>
</property>
<property>
        <name>hbase.cluster.distributed</name>
        <value>true</value>
</property>
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8

4.3.3启动Hbase

启动之前,先启动hadoop:

    ./sbin/start-all.sh
  • 1
  • 1

再启动hbase:

  ./bin/start-hbase.sh
  • 1
  • 1
 
 

以上是关于转载Hadoop 2.7.3 和Hbase 1.2.4安装教程的主要内容,如果未能解决你的问题,请参考以下文章

转载Hadoop官方文档翻译——HDFS Architecture 2.7.3

Todo转载全栈工程师-Hadoop, HBase, Hive, Spark

ubuntu18.04 基于Hadoop3.1.2集群的Hbase2.0.6集群搭建

Hmaster 没有使用 hadoop 2.7.1 启动 hbase 1.1.2

生产环境下hadoop HA集群及Hbase HA集群配置

Hadoop+Hbase分布式集群架构“完全篇