Hive为什么适合做数据仓库

Posted 杨鑫newlfe

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Hive为什么适合做数据仓库相关的知识,希望对你有一定的参考价值。

HIve最适合于数据仓库应用程序,使用该应用程序进行相关的静态数据分析, 不需要快速响应给出结果,而且数据本身不会频繁变化。
Hive不是一个完整的数据库。Hadoop以及HDFS的设计本身约束和局限性地限制了Hive所胜任的工作。 其中最大的限制就是Hive不支持记录级别更新、插入、或者删除操作。但是用户可以通过查询生成新表或者将查询结果导入文件中。同时,因为Hadoop是一个面向批处理的系统,而MapReduce任务(Job)的启动过程需要消耗较长的时间,所以Hive查询延时比较严重。传统数据库中在秒级别可以完成的查询,在Hive中,即使数据集相对较小,往往也需要执行更长的时间。最后需要说明的是,Hive不支持事务。 因此,Hive不支持OLTP(联机事务处理)所需要的关键功能,而更接近成为一个OLAP(连接分析处理)工具。 但是我们看到,由于Hadoop本身的时间开销很大,并且Hadoop所被设计用来处理数据规模非常大, 因此提交查询和返回结果是可能具有非常大的延时的,所以Hive并没有满足OLAP

以上是关于Hive为什么适合做数据仓库的主要内容,如果未能解决你的问题,请参考以下文章

hive学习

hive 和hbase 有啥区别

Hive是啥,Hive与关系型数据库的区别

hive

数据仓库Hive

一文带你了解Hive详细介绍Hive与传统数据库有什么区别?