Hbase入门

Posted liaozhilong

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Hbase入门相关的知识,希望对你有一定的参考价值。

Hbase入门

简介

HBase是一个构建在HDFS之上的,分布式的,面向列的开源数据库,由Google BigTable的开源
实现,它主要用于存储海量数据,是Hadoop生态系统中的重要一员。

HBase的优势

成熟

  1. 社区成熟
  2. 理论充分经过实践
  3. 丰富的工具支持

高效

  1. 将随机读写转化为顺序读写,适应高并发写入
  2. 均衡效果好读写性能和机器数保持线性相关
  3. 行中没有保存数据的列不占存储空间

分布式特性

  1. 基于HDFS、Zookeeper
  2. 一致性、可用性、分区容忍性
  3. 大数据存储
  4. 易扩展

HBase的特点

  1. 大:一个表可以有数十亿行,上百万列
  2. 面向列:面向列(族)的存储和权限访问,列(族)独立索引
  3. 稀疏:对于为空(null)的列,并不占用存储空间,因此,表可以设计的非常稀疏。
  4. 数据类型单一:HBase中的数据类型都是字符串(string)
  5. 无模式:每行都有一个可排序的主键和任意多的列,列可以根据需要动态增加,同一张表中不同的行可以有截然不同的列

HBase和RDBMS的区别

  1. 数据类型:HBase中的数据都是字符串类型(String)
  2. 数据操作:HBase只有普通的增、删、改、查等操作,没有表之间的关联查询,如果想进行关联查询的话,可以自己写MapReduce
  3. 存储模式:HBase是基于列式存储的,而RDBMS是基于行式存储的
  4. 应用场景:HBase适合存储大量数据,查询效率极高,HBase自带索引,即使是在上亿的数据中,也可以保证查询数据在毫秒以内。


以上是关于Hbase入门的主要内容,如果未能解决你的问题,请参考以下文章

HBase学习01(HBase入门及HBase Shell简单操作)

Hbase入门笔记----架构以及应用介绍

大数据技术之HBaseHBase简介HBase快速入门HBase进阶

HBase 基本入门篇

大数据技术之HBaseHBase简介HBase快速入门HBase进阶

大数据技术之HBaseHBase简介HBase快速入门HBase进阶