拆分 hive 分区以创建多个分区

Posted

技术标签:

【中文标题】拆分 hive 分区以创建多个分区【英文标题】:Split hive partition to create multiple partition 【发布时间】:2017-12-08 05:48:16 【问题描述】:

我有一个在 load_date (DD-MM-YYYY) 分区的外部配置单元表。但是第一个时期可以说 01-01-2000 包含从 1980 年到 2000 年的所有数据。如何在保留现有数据的同时进一步为以前的数据创建分区(加载日期大于 01-01-2000 的数据) 仍然可用

【问题讨论】:

请把问题说得更清楚些。我是否假设您有一个分区来保存 2000 年或之前的所有数据?从 2001 年起,您有每日分区吗?那你要加载什么。一个具体的例子可以帮助我们回答这个问题。 【参考方案1】:

首先将'01-01-2000'的数据加载到表中,并创建一个以数据'01-01-2000'进行分区的动态分区表。这可能会解决您的问题。

【讨论】:

其实我还不想看到所有其他分区。问题陈述可以这样写,外部表在加载日期列上进行分区,需要在数据日期列上进行分区。我们该怎么做?

以上是关于拆分 hive 分区以创建多个分区的主要内容,如果未能解决你的问题,请参考以下文章

HIVE:在分区表中映射联接

关于Hive的调优(本身,sql,mapreduce)

创建分区表 以及拆分分区表(修改分区)

ORACLE 分区表分区拆分

使用 bigquery 和单个查询进行分区,根据日期将表拆分为多个表

通过动态增加拆分在 oracle 中创建拆分分区