hive 分区表与数据产生关联的三种方式

Posted tele-share

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了hive 分区表与数据产生关联的三种方式相关的知识,希望对你有一定的参考价值。

所谓关联,可以理解为能够使用select查询到

1.load

这是最常用的一种方式

load data local inpath "数据路径" into table table_name partition(分区字段)

使用load加载数据会自动创建分区的,这样你加载的数据就会和分区表进行关联,之后select就可以了

 

2.修复命令

这种方式是先使用hive创建分区目录,然后用put上传数据,最后使用msck repair进行修复,所谓修复实质是创建分区,即Added partition to metastore ...

dfs -mkdir -p  "分区路径"

dfs -put  "数据路径" "分区路径"

最后修复

msck repair table table_name

 

3.上传数据后使用alter增加分区

dfs -mkdir -p  "分区路径"

dfs -put  "数据路径" "分区路径"

alter table table_name add partition(xxx)

之后也可以查询到

 

综上,load方式最为简洁

 

以上是关于hive 分区表与数据产生关联的三种方式的主要内容,如果未能解决你的问题,请参考以下文章

hive 表的创建的操作与测试

hive 表的创建的操作与测试

示例讲解PostgreSQL表分区的三种方式

Hive分区(静态分区+动态分区)

FlinkFlink1.12.0 FlinkSQL消费Kafka 使用 temporal join 关联维表Hive 最新分区数据 join 不上

Hive 教程-分区表与分桶表