有了Hive为什么还要用Impala?

Posted 余生备忘

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了有了Hive为什么还要用Impala?相关的知识,希望对你有一定的参考价值。


程序员jax和vicky的每日提炼第三天 From 余生备忘 01:41


Hive Impala
架构类型 主要是是基于 MapReduce 最近开始支持可插性执行引擎如Spark、Tez等。 大规模并行处理MMP,大量使用RAM。
底层语言 Java C++
主要使用者 数据工程师 数据分析师和数据科学家
优点 错误容忍度高,可以实现超大事实表之间的连接。 错误容忍度低,主要用于分布式查询,非常适用于星型模式连接。
支持的文件或数据格式 支持hadoop文件及各种结构化和半结构化的格式 最适用于Apache Parquet新型列式存储格式

文中名词:MMP:massively parallel processing

RAM:随机存取存储器 Random Access Memory


以上是关于有了Hive为什么还要用Impala?的主要内容,如果未能解决你的问题,请参考以下文章

为什么使用Hive和Impala

impala的 now 用hive怎么实现

Hive

为啥 impala 不显示 Hive 创建的所有表

Impala 创建外部表,由 Hive 存储

为啥数组值出现在 impala 中而不是 hive 中?