从放弃到入门27之大数据Cloudera Impala
Posted 晓诚之家
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了从放弃到入门27之大数据Cloudera Impala相关的知识,希望对你有一定的参考价值。
今天是2019年4月15日星期一
各位朋友,早上好!
早期早睡身体好,今天说说Cloudera Impala !!!!!!
什么是Impala?
Impala是用于处理存储在Hadoop集群中的大量数据的MPP(大规模并行处理)SQL查询引擎。 它是一个用C ++和Java编写的开源软件。 与其他Hadoop的SQL引擎相比,它提供了高性能和低延迟。
换句话说,Impala是性能最高的SQL引擎(提供类似RDBMS的体验),它提供了访问存储在Hadoop分布式文件系统中的数据的最快方法。
为什么选择Impala?
Impala通过使用标准组件(如HDFS,HBase,Metastore,YARN和Sentry)将传统分析数据库的SQL支持和多用户性能与Apache Hadoop的可扩展性和灵活性相结合。
Impala将相同的元数据,SQL语法(Hive SQL),ODBC驱动程序和用户界面(Hue Beeswax)用作Apache Hive,为面向批量或实时查询提供熟悉且统一的平台。
与Apache Hive不同,Impala不基于MapReduce算法。 它实现了一个基于守护进程的分布式架构,它负责在同一台机器上运行的查询执行的所有方面。
因此,它减少了使用MapReduce的延迟,这使Impala比Apache Hive快。
关系数据库和Impala 比较
Hive,Hbase和Impala 比较
虽然Cloudera Impala使用与Hive相同的查询语言,元数据和用户界面,但在某些方面它与Hive和HBase不同。
感谢大家的支持!雅俗共赏!
分享,让更多的朋友获取知识和技术的收益!
谢谢您的支持!
以上是关于从放弃到入门27之大数据Cloudera Impala的主要内容,如果未能解决你的问题,请参考以下文章
Cloudera Spark 及 Hadoop 开发员培训学习北京上海