使用当前日期进行Hive分区

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了使用当前日期进行Hive分区相关的知识,希望对你有一定的参考价值。

我有一些像这样的样本日期

1,prasad,Newyork
2,Tarak,Mexico

我想使用当前日期使用分区将此数据加载到hive表中,当我明天再次加载此数据时,应使用明天的日期对其进行分区。

这有可能在蜂巢中实现这一目标。

答案

在current_date函数中使用配置单元生成当前日期

hive> select current_date;
+-------------+--+
|     _c0     |
+-------------+--+
| 2018-06-18  |
+-------------+--+

您的插入查询将是

Insert into <db_name>.<target_tab_name> partition(<field_name>) select *,current_date from <db_name>.<source_tab_name>

通过在将数据加载到目标表时使用上述查询,日期将动态更改。

以上是关于使用当前日期进行Hive分区的主要内容,如果未能解决你的问题,请参考以下文章

深入理解Hive分区与分桶

如何获取hive建表语句

如何生成hive的建表语句

Hive 动态分区

将 Spark 数据帧保存为 Hive 中的动态分区表

hive分区