Hbase入门
Posted liaozhilong
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Hbase入门相关的知识,希望对你有一定的参考价值。
Hbase入门
简介
HBase是一个构建在HDFS之上的,分布式的,面向列的开源数据库,由Google BigTable的开源
实现,它主要用于存储海量数据,是Hadoop生态系统中的重要一员。
HBase的优势
成熟
- 社区成熟
- 理论充分经过实践
- 丰富的工具支持
高效
- 将随机读写转化为顺序读写,适应高并发写入
- 均衡效果好读写性能和机器数保持线性相关
- 行中没有保存数据的列不占存储空间
分布式特性
- 基于HDFS、Zookeeper
- 一致性、可用性、分区容忍性
- 大数据存储
- 易扩展
HBase的特点
- 大:一个表可以有数十亿行,上百万列
- 面向列:面向列(族)的存储和权限访问,列(族)独立索引
- 稀疏:对于为空(null)的列,并不占用存储空间,因此,表可以设计的非常稀疏。
- 数据类型单一:HBase中的数据类型都是字符串(string)
- 无模式:每行都有一个可排序的主键和任意多的列,列可以根据需要动态增加,同一张表中不同的行可以有截然不同的列
HBase和RDBMS的区别
- 数据类型:HBase中的数据都是字符串类型(String)
- 数据操作:HBase只有普通的增、删、改、查等操作,没有表之间的关联查询,如果想进行关联查询的话,可以自己写MapReduce
- 存储模式:HBase是基于列式存储的,而RDBMS是基于行式存储的
- 应用场景:HBase适合存储大量数据,查询效率极高,HBase自带索引,即使是在上亿的数据中,也可以保证查询数据在毫秒以内。
以上是关于Hbase入门的主要内容,如果未能解决你的问题,请参考以下文章
HBase学习01(HBase入门及HBase Shell简单操作)
大数据技术之HBaseHBase简介HBase快速入门HBase进阶