Hive性能优化(新手重新标注版)

Posted 金戈拉斯

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Hive性能优化(新手重新标注版)相关的知识,希望对你有一定的参考价值。

以下是一个技术小白根据自己的理解能力在别人整理的基础上进行了一些重点标识和归纳。

一个Hive查询生成多个Map Reduce Job,一个Map Reduce Job又有Map,Spill,Shuffle,Sort,Reduce等多个阶段,所以针对Hive查询的优化可以大致分为针对MR中单个步骤的优化(其中又会有细分),针对MR全局的优化,和针对整个查询(多MR Job)的优化,下文会分别阐述。

 

在开始之前,先把MR的流程图帖出来(摘自Hadoop权威指南),方便后面对照。另外要说明的是,这个优化只是针对Hive 0.9版本,而不是后来Hortonwork发起Stinger项目之后的版本。相对应的Hadoop版本是1.x而非2.x。

以上是关于Hive性能优化(新手重新标注版)的主要内容,如果未能解决你的问题,请参考以下文章

Hive性能优化

hive性能优化及参数调优

Hive性能优化之计算Job执行优化

Hive性能优化之表设计优化

Hive性能优化之表数据优化

Hive性能优化