hive 分区表与数据产生关联的三种方式
Posted tele-share
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了hive 分区表与数据产生关联的三种方式相关的知识,希望对你有一定的参考价值。
所谓关联,可以理解为能够使用select查询到
1.load
这是最常用的一种方式
load data local inpath "数据路径" into table table_name partition(分区字段)
使用load加载数据会自动创建分区的,这样你加载的数据就会和分区表进行关联,之后select就可以了
2.修复命令
这种方式是先使用hive创建分区目录,然后用put上传数据,最后使用msck repair进行修复,所谓修复实质是创建分区,即Added partition to metastore ...
dfs -mkdir -p "分区路径"
dfs -put "数据路径" "分区路径"
最后修复
msck repair table table_name
3.上传数据后使用alter增加分区
dfs -mkdir -p "分区路径"
dfs -put "数据路径" "分区路径"
alter table table_name add partition(xxx)
之后也可以查询到
综上,load方式最为简洁
以上是关于hive 分区表与数据产生关联的三种方式的主要内容,如果未能解决你的问题,请参考以下文章
FlinkFlink1.12.0 FlinkSQL消费Kafka 使用 temporal join 关联维表Hive 最新分区数据 join 不上