Hadoop中Hbase的体系结构

Posted 透明1190

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Hadoop中Hbase的体系结构相关的知识,希望对你有一定的参考价值。

HRegion

当一张表中的数据特别多的时候,HBase把表拆成多个块,每个块就是一个HRegion,每个region中包含这个表里的所有行

HRegionServer

数据库的数据存在HDFS文件系统中,用户通过HRegionServer来获取数据,一台机器上一般只能运行一个HRegionServer,一个HRegion只能属于一个HRegionServer。

一个Server中有一个HLOG和多个HRegion组成,HLOG用来恢复数据。数据保存跟新时采用先写HLOG的方式。每个HRegion中有一个MemStore和多个StoreFile。数据操作时先缓存在MemStore中,当MemStore超过限制才会刷新到StoreFile中。数据的更新不直接更新采用追加的方式,当StoreFile数量达到最大限制会触发合并操作,这时才会做更新和删除。

HMaster

管理HRegionServer,给HRegionServer分配Region,并根据HRegionServer的加入和故障情况动态调整Region

ZooKeeper

负责监控各个机器的状态,当HRegionServer发生了故障,会通知HMaster去处理。当HMaster故障时,也负责HMaster的恢复工作。

 

以上是关于Hadoop中Hbase的体系结构的主要内容,如果未能解决你的问题,请参考以下文章

Hbase之修改表结构

HBase体系结构(上)

HBase 系列—— HBase 简介

你也能看懂Hadoop——Hbase

Hadoop核心架构HDFS+MapReduce+Hbase+Hive内部机理详解

数据管理技术HBase所处的的系统生态Hadoop