HBase 的存储结构

Posted 性能与架构

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了HBase 的存储结构相关的知识,希望对你有一定的参考价值。

HBase 中的表常常是超级大表,这么大的表,在 HBase 中是如何存储的呢?

HBase 会对表按行进行切分,划分为多个区域块儿,每个块儿名为 HRegion



HBase 是集群结构,会把这些块儿分散存储到多个服务器中,每个服务器名为 HRegionServer

HBase 的存储结构

服务器多了,就需要一个管理者 HMaster,负责 HRegion 的分配、HRegionServer 负载均衡的处理 等事务

HBase 的存储结构

当某个 HRegion 的大小达到阈值后,便会被分割开来,新的 HRegion 也会由 HMaster 进行分配,放置到合适的 HRegionServer 中

HRegion 是 HBase 中分布式存储的最小单元,但并不是存储的最小单元

HRegion 内部会按照列族进行切分,分为多个 Store,每个 Store 保存一个列族,所以 HRegion 由一个或者多个 Store 组成

HBase 的存储结构

每个 Strore 又由一个 MemStore 和 N个 StoreFile 组成

MemStore 是内存存储单元,当内存中数据达到阈值后,写入 StoreFile,StoreFile 以 HFile 格式保存

HBase 的存储结构

HBase 数据的物理存储是基于 Hadoop 的分布式存储的



这样,综合起来便形成了 HBase 的整体架构图





点击 “阅读原文” 查看 文章列表

以上是关于HBase 的存储结构的主要内容,如果未能解决你的问题,请参考以下文章

HBase 的存储结构

Hbase-存储结构(逻辑物理)

如果我们使用Hadoop处理大数据,那么数据会存储在哪里因为hadoop数据库HBase存储结构化数据而大数据是非结构化数据

一文说清HBase的存储结构

大数据之Hbase:HBase简介

HBase – 存储文件HFile结构解析