大数据框架-Hbase

Posted xiongchang95

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了大数据框架-Hbase相关的知识,希望对你有一定的参考价值。

大规模结构化集群存储数据库。Table中的所有行都按照row key的字典序排列。

主键:row Key。访问行只能通过rowKey访问(范围或者准确值),或者全表扫描;

列族:cloumn family。hbase表中的每个列,都归属与某个列族。列族是表的schema的一部分(而列不是),必须在使用表之前定义。以二进制数据存储。

时间戳:timestamp。HBase中通过row和columns确定的为一个存贮单元称为cell。每个 cell都保存着同一份数据的多个版本。版本通过时间戳来索引, 时间戳的类型是 64位整型。每个 cell中,不同版本的数据按照时间倒序排序,即最新的数据排在最前面。

Region:    是Hbase中分布式存储和负载均衡的最小单元,不同region可分布在不同server上。 region按大小分割的,每个表一开始只有一个region,随着数据不断插入表,region不断增大,当增大到一个阀值的时候,Hregion就会等分会两个新的Hregion。

Store:每个Region由多个store组成,一个sotre对应一个列族。每个Strore又由一个memStore和多个StoreFile组成,StoreFile以HFile格式保存在HDFS上。

Client、regiongServer、master

技术分享图片

 

以上是关于大数据框架-Hbase的主要内容,如果未能解决你的问题,请参考以下文章

hbase 表的设计与其它大数据框架的集成

大数据入门学习框架

大数据入门学习框架

大数据离线计算路线图-Hadoop工程师,数据分析师

大数据 常用框架特点

大数据存储- Hbase 基础