数据热门深入浅出数据仓库中SQL性能优化之Hive篇
Posted 小象
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据热门深入浅出数据仓库中SQL性能优化之Hive篇相关的知识,希望对你有一定的参考价值。
一个Hive查询生成多个Map Reduce Job,一个Map Reduce Job又有Map,Reduce,Spill,Shuffle,Sort等多个阶段,所以针对Hive查询的优化可以大致分为针对MR中单个步骤的优化(其中又会有细分),针对MR全局的优化,和针对整个查询(多MR Job)的优化,下文会分别阐述。
在开始之前,先把MR的流程图帖出来(摘自Hadoop权威指南),方便后面对照。另外要说明的是,这个优化只是针对Hive 0.9版本,而不是后来Hortonwork发起Stinger项目之后的版本。相对应的Hadoop版本是1.x而非2.x。
来源:CSDN云计算
以上是关于数据热门深入浅出数据仓库中SQL性能优化之Hive篇的主要内容,如果未能解决你的问题,请参考以下文章
深入浅出 SQL 优化器原理
Hive架构原理和性能优化
Hive 优化详解
HIVE SQL 优化之数据倾斜
Hive企业级性能优化
Hive SQL的编译过程