impala 实操
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了impala 实操相关的知识,希望对你有一定的参考价值。
参考技术A impala操作环境impala-shell实操
impala不支持insert overwrite 的方式导出数据,需要使用-o outputpath的方式导出。
查询语句与hive基本一致
impala性能相关
impala关联操作左大右小,如果没有按照左大右小的规则写,impala会按照表统计信息进行优化,但是这么做是依赖 历史 表统计信息进行优化的,所以在遇到性能非常差的场景时可以从新刷一下表统计信息。
在执行大批量任务的时候通常会有非常多任务脚本,在任务提交的时候应该轮询发送到不同的imapad节点上进行,而不应该在同一个impalad节点上执行,会导致单一impalad节点的oom,也严重影响并发性能,在执行的过程中通过-i指定impalad的节点。
impala执行计划解读
在hue上可以查看执行计划树,并且可以直观的看到每个环节所用的时间。
海汼部落原创文章,原文链接:(http://hainiubl.com/topics/75547)
以上是关于impala 实操的主要内容,如果未能解决你的问题,请参考以下文章