大数据开发|HBASE分布式数据库环境构建

Posted 读数会

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了大数据开发|HBASE分布式数据库环境构建相关的知识,希望对你有一定的参考价值。

提前说明一下,大数据的搭建环境都是在Linux系统下构建,可能针对一些没有Linux编程基础的同学来说会有一些吃力,请各位客官放心,小店伙计后期会专门有几期来讲解Linux编程基础。绝对保证零基础完成大数据环境的构建。今天主要是构建HBASE分布式数据库。

服务器时间同步

编写的一个脚本,来同步时间

大数据开发|HBASE分布式数据库环境构建(3)

#!/bin/bash

###设置参数

hostname_file="/home/hadoop/cdh_installpag/shell/time_tongbu.cfg"

###获取本地时间

localdate=`date +%Y%m%d' '%T`

cat $hostname_file |while read hostname

do

ssh ${hostname}  date -s "'$localdate'" < /dev/null

if [ $? -ne 0 ];then

echo "[ `date +%Y%m%d' '%T` ]**********将本机系统时间同步至$hostname失败****************";

exit 1;

else

echo "[ `date +%Y%m%d' '%T` ]**********将本机系统时间同步至$hostname成功****************";

fi

done

大数据开发|HBASE分布式数据库环境构建(3)

该目录/home/hadoop/cdh_installpag/shell/time_tongbu.cfg的数据格式如下:

大数据开发|HBASE分布式数据库环境构建(3)

问题:

大数据开发|HBASE分布式数据库环境构建(3)

shell执行结果:

大数据开发|HBASE分布式数据库环境构建(3)

检测:

大数据开发|HBASE分布式数据库环境构建(3)
大数据开发|HBASE分布式数据库环境构建(3)
大数据开发|HBASE分布式数据库环境构建(3)

查看时间都是一致的了。

安装zookeeper组件

这个步骤请参考Hadoop分布式集群环境构建(1)

HBase 安装配置

1)、下载hbase安装包并解压

大数据开发|HBASE分布式数据库环境构建(3)

下载链接:http://pan.baidu.com/s/1hrDkXak 密码:i1ow

解压:

tar   -zxvf  hbase-1.0.0-cdh5.4.0.tar.gz  -C   /home/hadoop/

大数据开发|HBASE分布式数据库环境构建(3)

2)、配置 hbase-env.sh

cd  /home/hadoop/hbase/conf

vi   hbase-env.sh

添加如下的内容:

export JAVA_HOME=/home/hadoop/jdk

export HBASE_CLASSPATH=/home/hadoop/hadoop/etc/hadoop

export HBASE_HEAPSIZE=4000

export HBASE_LOG_DIR=/home/hadoop/hbase/logs

export HBASE_MANAGES_ZK=false

大数据开发|HBASE分布式数据库环境构建(3)

其中JAVA_HOME 是java的安装目录

HBASE_CLASSPATH 是hadoop的配置文件目录

HBASE_HEAPSIZE 的大小根据你的集群配置,默认是 1000

HBASE_LOG_DIR 是 HBase 日志存放位置

HBASE_MANAGES_ZK=false 含义为 hbase 不托管 zookeeper 的启动与关闭,因为笔者的 ZooKeeper 是独立安装的

3)、配置 hbase-site.xml

vi hbase-site.xml

加入如下内容

<configuration>

<property>

<name>hbase.rootdir</name>

<value>hdfs://mycluster/hbase</value>

</property>

<property>

<name>hbase.cluster.distributed</name>

<value>true</value>

</property>

<property>

<name>hbase.master</name>

<value>60000</value>

</property>

<property>

<name>hbase.tmp.dir</name>

<value>/home/hadoop/hadoop/data/hbase-tmp</value>

</property>

<property>

<name>hbase.zookeeper.quorum</name>

<value>hadoop3,hadoop4,hadoop5</value>

</property>

<property>

<name>hbase.zookeeper.property.dataDir</name>

<value>/home/hadoop/hadoop/data/hbasezk</value>

</property>

<property>

<name>hbase.zookeeper.property.clientPort</name>

<value>2181</value>

</property>

<property>

<name>zookeeper.session.timeout</name>

<value>120000</value>

</property>

<property>

<name>hbase.regionserver.restart.on.zk.expire</name>

<value>true</value>

</property>

<property>

<name>hbase.master.maxclockskew</name>

<value>180000</value>

<description>Time difference of regionserver from master</description>

</property>

<property>

<name>hbase.regionserver.thrift.http</name>

<value>true</value>

</property>

<property>

<name>hbase.thrift.support.proxyuser</name>

<value>true</value>

</property>

</configuration>

大数据开发|HBASE分布式数据库环境构建(3)

4)、配置 regionservers

vi  regionservers

加入如下内容(注意  根据自己实际情况添加)

大数据开发|HBASE分布式数据库环境构建(3)

5)、将hadoop中的hdfs-site.xml 与core-site.xml拷贝到hbase的conf目录

大数据开发|HBASE分布式数据库环境构建(3)

至此hbase基本配置完成。

6)、分发hbase修改好的安装包到其他主机

scp /home/hadoop/hbase/  hadoop@hadoop3:/home/hadoop/

scp /home/hadoop/hbase/  hadoop@hadoop5:/home/hadoop/

启动hbase

在其中hadoop4主机上启动 Hmaster,执行命令。

start-hbase.sh

大数据开发|HBASE分布式数据库环境构建(3)
大数据开发|HBASE分布式数据库环境构建(3)

因为采用的是HA模式,所以需要启动另一台备用主节点

./hbase-daemon.sh start master

大数据开发|HBASE分布式数据库环境构建(3)
大数据开发|HBASE分布式数据库环境构建(3)

hbase  shell基本测试

1)、hbase  shell

大数据开发|HBASE分布式数据库环境构建(3)

创建表查看表

至此hbase安装成功

后面会不定期的更新有关大数据、云计算、数据挖掘等方面的知识点,欢迎大家持续关注。如果对该知识点有疑问,欢迎在留言区留言讨论。



以上是关于大数据开发|HBASE分布式数据库环境构建的主要内容,如果未能解决你的问题,请参考以下文章

大数据学习笔记55:搭建HBase环境

浅谈大数据HBase的开发

小白视角大数据基础实践 分布式数据库HBase的常用操作

HBase分享 | 基于HBase和Spark构建企业级数据处理平台

大数据离线开发7.2 搭建HBase环境

大数据离线开发7.2 搭建HBase环境