Hive学习参数设置

Posted 2022-05-18 wwbz

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Hive学习参数设置相关的知识，希望对你有一定的参考价值。

Hive的参数设置方式

1、配置文件（全局有效）

2、命令行参数（对 hive 启动实例有效）

3、参数声明（对 hive 的连接 session 有效）

Hive 的配置文件包括：

　　A.　用户自定义配置文件：$HIVE_CONF_DIR/hive-site.xml

　　B.　默认配置文件：$HIVE_CONF_DIR/hive-default.xml

用户自定义配置会覆盖默认配置。

另外，Hive 也会读入 Hadoop 的配置，因为 Hive 是作为 Hadoop 的客户端启动的，Hive 的配置会覆盖 Hadoop 的配置。

配置文件的设定对本机启动的所有 Hive 进程都有效。

启动 Hive（客户端或 Server 方式）时，可以在命令行添加-hiveconf param=value 来设定参数，这一设定对本次启动的 session（对于 server 方式启动，则是所有请求的 session）有效。

bin/hive -hiveconf hive.root.logger=INFO,console

可以在 HQL 中使用 SET 关键字设定参数

set hive.exec.dynamic.partition=true;  
set hive.exec.dynamic.partition.mode=nonstrict;

set hive.exec.parallel=true;
set hive.exec.parallel.thread.number=8;

map join 概念：将其中做连接的小表（全量数据）分发到所有 MapTask 端进行 Join，从而避免了 reduceTask，前提要求是内存足以装下该全量数据

set hive.auto.convert.join=true; //设置 MapJoin 优化自动开启
set hive.mapjoin.smalltable.filesize=25000000 //设置小表不超过多大时开启 mapjoin 优化

以上是关于Hive学习参数设置的主要内容，如果未能解决你的问题，请参考以下文章