从放弃到入门27之大数据Cloudera Impala

Posted 晓诚之家

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了从放弃到入门27之大数据Cloudera Impala相关的知识,希望对你有一定的参考价值。

今天是2019年4月15日星期一


各位朋友,早上好!


早期早睡身体好,今天说说Cloudera Impala !!!!!!



什么是Impala?


Impala是用于处理存储在Hadoop集群中的大量数据的MPP(大规模并行处理)SQL查询引擎。 它是一个用C ++和Java编写的开源软件。 与其他Hadoop的SQL引擎相比,它提供了高性能和低延迟。

换句话说,Impala是性能最高的SQL引擎(提供类似RDBMS的体验),它提供了访问存储在Hadoop分布式文件系统中的数据的最快方法。


为什么选择Impala?

Impala通过使用标准组件(如HDFS,HBase,Metastore,YARN和Sentry)将传统分析数据库的SQL支持和多用户性能与Apache Hadoop的可扩展性和灵活性相结合。


Impala将相同的元数据,SQL语法(Hive SQL),ODBC驱动程序和用户界面(Hue Beeswax)用作Apache Hive,为面向批量或实时查询提供熟悉且统一的平台。


与Apache Hive不同,Impala不基于MapReduce算法。 它实现了一个基于守护进程的分布式架构,它负责在同一台机器上运行的查询执行的所有方面。

因此,它减少了使用MapReduce的延迟,这使Impala比Apache Hive快。


关系数据库和Impala 比较


Hive,Hbase和Impala 比较


虽然Cloudera Impala使用与Hive相同的查询语言,元数据和用户界面,但在某些方面它与Hive和HBase不同。


感谢大家的支持!雅俗共赏!


分享,让更多的朋友获取知识和技术的收益!


谢谢您的支持!



以上是关于从放弃到入门27之大数据Cloudera Impala的主要内容,如果未能解决你的问题,请参考以下文章

Cloudera Spark 及 Hadoop 开发员培训学习北京上海

Webpack 3 从入门到放弃

一旦我已经在 impala shell 中,如何运行 .sql 文件?

mysql从入门到放弃-入门知识介绍

Ldap 从入门到放弃

Python从入门到放弃_字典