impala 实操

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了impala 实操相关的知识,希望对你有一定的参考价值。

参考技术A impala操作环境

impala-shell实操

impala不支持insert overwrite 的方式导出数据,需要使用-o outputpath的方式导出。

查询语句与hive基本一致

impala性能相关

impala关联操作左大右小,如果没有按照左大右小的规则写,impala会按照表统计信息进行优化,但是这么做是依赖 历史 表统计信息进行优化的,所以在遇到性能非常差的场景时可以从新刷一下表统计信息。

在执行大批量任务的时候通常会有非常多任务脚本,在任务提交的时候应该轮询发送到不同的imapad节点上进行,而不应该在同一个impalad节点上执行,会导致单一impalad节点的oom,也严重影响并发性能,在执行的过程中通过-i指定impalad的节点。

impala执行计划解读

在hue上可以查看执行计划树,并且可以直观的看到每个环节所用的时间。

海汼部落原创文章,原文链接:(http://hainiubl.com/topics/75547)

以上是关于impala 实操的主要内容,如果未能解决你的问题,请参考以下文章

怎么操作以kudu为引擎的hive数据库,使用IMPALA方式操作

什么是impala,如何安装使用Impala

什么是impala,如何安装使用Impala

什么是impala,如何安装使用Impala

什么是impala,如何安装使用Impala

什么是impala,如何安装使用Impala