Impala快速入门

Posted yszd

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Impala快速入门相关的知识,希望对你有一定的参考价值。

一.简介

  Cloudera公司推出,提供对HDFS、Hbase数据的高性能、低延迟的交互式SQL查询功能。基于Hive使用内存计算,兼顾数据仓库,具有实时、批处理、多并发的优点。是CDH平台首选的PB级大数据实时查询分析引擎。

二.优点

  1.基于内存计算,能够对PB级别数据进行交互式实时查询、分析

  2.无需转化MR,直接读取HDFS数据

  3.C++编写,LLVM统一编译运行

  4.兼容HiveSQL

  5.具有数据仓库的特点,可直接对hive数据进行分析

  6.支持数据本地化

  7.支持列式存储

  8.支持JDBC/ODBC远程连接

二.缺点

  1.对内存需求大

  2.C++编写,不开源

  3.完全依赖hive

  4.实践表明,当分区超过1W时性能严重下降

  5.稳定性不如hive

 

以上是关于Impala快速入门的主要内容,如果未能解决你的问题,请参考以下文章

EFK教程 - EFK快速入门指南

Python要如何快速入门?

Flume快速入门

Gojs 快速入门

Guzzle 的快速入门

Dva快速入门,5分钟入门10分钟精通