数据库与数据仓库的比较Hbase——Hive

Posted 新际航

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据库与数据仓库的比较Hbase——Hive相关的知识,希望对你有一定的参考价值。

 

 数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策。

(1) 面向主题:指数据仓库中的数据是按照一定的主题域进行组织。

(2)集成:指对原有分散的数据库数据经过系统加工, 整理得到的消除源数据中的不一致性。

(3)相对稳定:指一旦某个数据进入数据仓库以后只需要定期的加载、刷新。

(4)反映历史变化:指通过这些信息,对企业的发展历程和未来趋势做出定量分析预测。

 主要区别在于:

(1)数据库是面向事务的设计,数据仓库是面向主题设计的。

(2)数据库一般存储在线交易数据,数据仓库存储的一般是历史数据。

(3)数据库设计是尽量避免冗余,数据仓库在设计是有意引入冗余。

(4)数据库是为捕获数据而设计,数据仓库是为分析数据而设计。

 

以上是关于数据库与数据仓库的比较Hbase——Hive的主要内容,如果未能解决你的问题,请参考以下文章

数据仓库之数仓分层及hive分层

新数仓系列:Hbase周边生态梳理

Hive数仓项目架构说明环境搭建及数据仓库基础知识

hive 和hbase 有啥区别

HBase与Hive集成

大数据之Hbase:HBase与Hive的对比