Hbase架构,组件分析 ,Hbase集群搭建

Posted 2022-03-07 eric666666

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Hbase架构,组件分析 ,Hbase集群搭建相关的知识，希望对你有一定的参考价值。

1.hbase的架构

Hbase主要由master,regionserver,zookeeper,client,hdfs文件系统构成.

技术图片

Zk:记录hbase的表的元数据信息

hamster:进行region的分配,发出操作指令

Hlog:记录HregionServer的操作日志,保证数据的可靠性

HRegion:存储Hbase表的信息

store:Hbase表的不同列族的存储

DataNode:存储Hbase的Hlog及Hbase表的Hfile的文件持久化存储

2.hbase的组件及作用

1）Client

访问Hbase的接口， Client中具有 cache来加速Hbase的访问，比如cache的.META.元数据的信息。

2）Zookeeper

HBase通过Zookeeper来做master的高可用、RegionServer的监控、元数据的入口以及集群配置的维护等工作。

通过Zoopkeeper来保证集群中只有1个master在运行，如果master异常，会通过竞争机制产生新的master提供服务

通过Zoopkeeper来监控RegionServer的状态，当RegionSevrer有异常的时候，通过回调的形式通知Master RegionServer上下线的信息

通过Zoopkeeper存储元数据的统一入口地址

3）Hmaster

master节点的主要职责如下：

为RegionServer分配Region

维护整个集群的负载均衡

维护集群的元数据信息

发现失效的Region，并将失效的Region分配到正常的RegionServer上

当RegionSever失效的时候，协调对应Hlog的拆分

4）HregionServer

HregionServer直接对接用户的读写请求，是真正的“干活”的节点。它的功能概括如下：

管理master为其分配的Region

处理来自客户端的读写请求

负责和底层HDFS的交互，存储数据到HDFS

负责Region变大以后的拆分

负责Storefile的合并工作

5）HDFS

HDFS为Hbase提供最终的底层数据存储服务，同时为HBase提供高可用（Hlog存储在HDFS）的支持，具体功能概括如下：

提供元数据和表数据的底层分布式存储服务

数据多副本，保证的高可靠和高可用性

3.hbase的读写流程

HBase读数据流程:

1）Client先访问zookeeper，从meta表读取region的位置，然后读取meta表中的数据。meta中又存储了用户表的region信息；

2）根据namespace、表名和rowkey在meta表中找到对应的region信息；

3）找到这个region对应的regionserver；

4）查找对应的region；

5）先从MemStore找数据，如果没有，再到BlockCache里面读；

6）BlockCache还没有，再到StoreFile上读(为了读取的效率)；

7）如果是从StoreFile里面读取的数据，不是直接返回给客户端，而是先写入BlockCache，再返回给客户端。

写入数据流程:

1）Client向HregionServer发送写请求；

2）HregionServer将数据写到HLog（write ahead log）。为了数据的持久化和恢复；

3）HregionServer将数据写到内存（MemStore）；

4）反馈Client写成功。

4.hbase集群搭建

伪分布式 :

1.hbase-env.sh中配置JAVA_HOME

2.配置hbase-site.xml如下

<name>hbase.rootdir</name>

<value>file:///root/hbaserootdir</value>

</property>

<name>hbase.zookeeper.property.dataDir</name>

<value>/root/zookeeper/data</value>

</property>

完全分布式搭建:

设置使用自定义的zookeeper：

需要在hbase-env.sh中设置HBASE_MANAGES_ZK为false

backup-masters配置：

node2

hbase-env.sh配置：

export JAVA_HOME=/usr/java/jdk1.7.0_80

export HBASE_MANAGES_ZK=false

hbase-site.xml配置：

<name>hbase.rootdir</name>

<value>hdfs://mycluster/hbase</value>

</property>

<name>hbase.zookeeper.quorum</name>

</property>

<name>hbase.zookeeper.property.dataDir</name>

<value>/var/hbase/zookeeper</value>

</property>

<name>hbase.cluster.distributed</name>

</property>

</configuration>

regionservers配置：

node2

node3

node4

将hdfs-site.xml拷贝到hbase的conf目录

或者使用软链接,将Hadoop的配置文件软连接到hbase的配置目录

bin/start-hbase.sh bin/stop-hbase.sh bin/hbase shell

HBase的WEB UI访问：

HMaster：http://node1:60010

以上是关于Hbase架构,组件分析 ,Hbase集群搭建的主要内容，如果未能解决你的问题，请参考以下文章

HBase集群搭建及hbaseshell使用

3台机器配置hadoop集群_Hadoop+Hbase 分布式集群架构

Hadoop Zookeeper Hbase Hive 分布式集群搭建实例

终于知道了Zookeeper在hbase集群中的作用

hbase基础架构