大数据之Hbase:HBase与Hive的对比

Posted 浊酒南街

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了大数据之Hbase:HBase与Hive的对比相关的知识,希望对你有一定的参考价值。

HBase与Hive的对比

1.1:Hive

(1) 数据仓库
Hive的本质其实就相当于将HDFS中已经存储的文件在mysql中做了一个双射关系,以方便使用HQL去管理查询。
(2) 用于数据分析、清洗
Hive适用于离线的数据分析和清洗,延迟较高。
(3) 基于HDFS、MapReduce
Hive存储的数据依旧在DataNode上,编写的HQL语句终将是转换为MapReduce代码执行。

1.2:HBase

(1) 数据库
是一种面向列族存储的非关系型数据库。
(2) 用于存储结构化和非结构化的数据
适用于单表非关系型数据的存储,不适合做关联查询,类似JOIN等操作。
(3) 基于HDFS
数据持久化存储的体现形式是HFile,存放于DataNode中,被ResionServer以region的形式进行管理。
(4) 延迟较低,接入在线业务使用
面对大量的企业数据,HBase可以直线单表大量数据的存储,同时提供了高效的数据访问速度。

以上是关于大数据之Hbase:HBase与Hive的对比的主要内容,如果未能解决你的问题,请参考以下文章

好程序员大数据分享:Hbase精解

大数据之Hbase:HBase之读写数据流程

大数据之Hbase:HBase简介

大数据之Hbase:Hbase面试题

大数据之Hbase:Hbase工作机制

大数据之Hbase:HBase优化