HBase笔记

Posted 好程序员

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了HBase笔记相关的知识,希望对你有一定的参考价值。

关注我的人都成为了月薪5w以上的技术大牛

1.应用场景和特点

hbase => 当数据量非常大的时候才会体现出hbase的优势

特点:

海量数据存储 => 单表可有上百亿行。上百万的列。也就是对列没有限制。 => 关系型数据库正常单表不超过五百万行,不超过三十列。

面向列 => 动态添加数据的时候生成列。单独对列进行各种操作。

多版本 

稀疏行 => 为空的列不占用磁盘空间。 => 关系型数据库当列为空的时候值会为null。也会占用磁盘空间

扩展性 => 底层依赖于HDFS => 数据内存不够的时候只需要动态添加机器就行。

高可靠性 => 

高性能 => 高写高读性能。

准实时查询 => 百毫秒实时查询上亿数据量

应用场景 :

交通,金融,电商,移动...

概念与定位

概念:

如何选择合适hbase的版本

官网版本 => https://archive.apache.org/dist/hbase/ => 较新

cdh版本 => http://archive.cloudera.com/cdh5/ => 较稳定,兼容性优。

定位:认识hbase在hadoop2.x生态系统中的定位

HBase笔记

架构体系与设计模型

架构体系:

HBase笔记

宏观图分析:
hbase内部有两个主要的进程服务 => Master/RegionServer

hbase依赖与两个外部服务 => HDFS(hbase的数据是基于HDFS存储的,也就是说写入hbase的数据最终落入到HDFS分布式文件系统中)/ZooKeeper(分布式的框架)

 regionserver管理集群上面的数据。会及时报告信息(状态和管理内容)给master服务。也会报告zookeeper。

 

设计模型:

关系型数据库:只需要设计数据库的列。并且要确定列的值,才能对数据进行操作。

hbase:面向列(列蔟)的数据库,不需要先制定列。只需要设定列蔟。

HBase笔记

例如下图

HBase笔记

在hbase表设计的时候,只需要确定column family即可。column family 的子列不需要制定,子列的生成是数据的动态增加而自动生成的。

表结构数据模型说明:

HBase笔记

HBase笔记

 

列蔟的概念:

 HBase笔记

hbase数据库与关系型数据的对比:



  • 程序员致力于移动互联网精英人才培养,开设全栈html5+、大数据+人工智能、JavaEE+云数据等多门课程。学员入职阿里、新浪、百度、搜狗等知名企业屡见不鲜,成就学员转行、就业,拿高薪进名企的梦想。大数据+人工智能课程1月15日开班在即,现报名免费试学30天,学费优惠5000元。


以上是关于HBase笔记的主要内容,如果未能解决你的问题,请参考以下文章

学习笔记HBase概念原理适用场景学习笔记

Hbase入门笔记----架构以及应用介绍

Hbase 技术细节笔记

HBase笔记整理

学习笔记HBase概念原理适用场景学习笔记

学习笔记HBase概念原理适用场景学习笔记