Hive:第 10 章 企业级调优

Posted 亿钱君

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Hive:第 10 章 企业级调优相关的知识,希望对你有一定的参考价值。

1. 执行计划(Explain)

案例实操:没有生成 MR 任务的

在这里插入图片描述
案例实操:有生成 MR 任务的
在这里插入图片描述

2. Fetch 抓取

3. 本地模式

Hive 可以通过本地模式在单台机器上处理所有的任务。对于小数据集,执行时间可以明显被缩短。

案例实操:
(1)开启本地模式,并执行查询语句

hive (default)> set hive.exec.mode.local.auto=true;
hive (default)> select count(*) from emp group by deptno;

(2)关闭本地模式(默认是关闭的),并执行查询语句

hive (default)> select count(*) from emp group by deptno;

4. 表的优化

4.1 小表大表 Join(MapJOIN)(已优化,无关系了)

在这里插入图片描述

4.2 大表 Join 大表

4.3 Group By

4.4 Count(Distinct) 去重统计

4.5 笛卡尔积

4.6 行列过滤

4.7 分区、 分桶

5. 合理设置 Map 及 Reduce 数

5.1 复杂文件增加 Map 数

5.2 小文件进行合并

5.3 合理设置 Reduce 数

6. 并行执行

7. 严格模式

8. JVM 重用

详见 hadoop 优化文档中 jvm 重用

9. 压缩

以上是关于Hive:第 10 章 企业级调优的主要内容,如果未能解决你的问题,请参考以下文章

企业级调优

企业级调优

Hive参数与性能企业级调优

Hive参数与性能企业级调优

Hive参数与性能企业级调优

Hive参数与性能企业级调优