从放弃到入门27之大数据Cloudera Impala

Posted 2021-04-24 晓诚之家

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了从放弃到入门27之大数据Cloudera Impala相关的知识，希望对你有一定的参考价值。

今天是2019年4月15日星期一

各位朋友，早上好！

早期早睡身体好，今天说说Cloudera Impala ！！！！！！

什么是Impala？

Impala是用于处理存储在Hadoop集群中的大量数据的MPP（大规模并行处理）SQL查询引擎。它是一个用C ++和Java编写的开源软件。与其他Hadoop的SQL引擎相比，它提供了高性能和低延迟。

换句话说，Impala是性能最高的SQL引擎（提供类似RDBMS的体验），它提供了访问存储在Hadoop分布式文件系统中的数据的最快方法。

Impala通过使用标准组件（如HDFS，HBase，Metastore，YARN和Sentry）将传统分析数据库的SQL支持和多用户性能与Apache Hadoop的可扩展性和灵活性相结合。

Impala将相同的元数据，SQL语法（Hive SQL），ODBC驱动程序和用户界面（Hue Beeswax）用作Apache Hive，为面向批量或实时查询提供熟悉且统一的平台。

与Apache Hive不同，Impala不基于MapReduce算法。它实现了一个基于守护进程的分布式架构，它负责在同一台机器上运行的查询执行的所有方面。

因此，它减少了使用MapReduce的延迟，这使Impala比Apache Hive快。

虽然Cloudera Impala使用与Hive相同的查询语言，元数据和用户界面，但在某些方面它与Hive和HBase不同。

感谢大家的支持！雅俗共赏！

分享，让更多的朋友获取知识和技术的收益！

谢谢您的支持！

以上是关于从放弃到入门27之大数据Cloudera Impala的主要内容，如果未能解决你的问题，请参考以下文章