Hive中如何快速的复制一张分区表(包括数据)

Posted 扛着锄头进城

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Hive中如何快速的复制一张分区表(包括数据)相关的知识,希望对你有一定的参考价值。

如果我们表的分区创建非常多的话,对于我们装载数据是一件非常麻烦的事,Hive提供动态分区来解决这个问题。
可以基于查询参数推断出需要创建的分区名称,相比的分区都是静态的,这里就称之为动态的分区。
怎么来弄呢?

 

首先复制表结构:

create table applogs like applogsnew;

然后执行插入:

INSERT overwrite TABLE applogsnew PARTITION(create_time)
SELECT applogid ,msgtype ,clienttype ,create_time FROM applogs;

报错了,需要我们开启动态分区的支持

 

set hive.exec.dynamic.partition=true;
set hive.exec.dynamic.partition.mode=nostrict;
set hive.exec.max.dynamic.partitions.pernode=1000;

再次执行

INSERT overwrite TABLE applogsnew PARTITION(create_time) 
SELECT applogid ,msgtype ,clienttype ,create_time FROM applogs;

备注:
在创建分区的时候,最好不要创建过多的分区,如果分区过多的话,查询也是非常的慢的,就像在window下一个文件夹下面的文件过多会对我们的使用造成非常的不便的。
那么hive能支持多大的分区数呢,可以使用命令set hive.exec.max.dynamic.partitions获取。

 

以上是关于Hive中如何快速的复制一张分区表(包括数据)的主要内容,如果未能解决你的问题,请参考以下文章

大数据组件之Hive 分区表

Hive的静态分区和动态分区

Hive:无法将数据从未分区表复制到分区表

Hive 复制分区表和数据

Hive插入多个分区时OOM故障解决记录

hive 复制一个分区到另一个分区