1.特点
Hadoop擅长存储任意的、半结构化数据,甚至非结构化数据。
列式存储:以列为单位聚合数据,然后列值顺序存入磁盘。
col1 | id1 | id2 | id3 |
col2 | name1 | null | name3 |
列式存储的需要:对于特定的查询,不是所有的值都是必须的;减少IO是主要因素;列的数据类型相似,有利于压缩,提高了压缩比,返回结果时能降低带宽的消耗。
从RDBMS角度看,HBase不是一个列式存储的数据库,但是他利用了磁盘的列式存储格式。
Hbase适用于键值对数据存取,或有序数据存取。