Hive 复制分区表和数据
Posted kimbo
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Hive 复制分区表和数据相关的知识,希望对你有一定的参考价值。
1. 非分区表:
复制表结构: create table new_table as select * from exists_table where 1=0;
复制表结构和数据: create table new_table as select * from exists_table;
2. 分区表:
-- 创建一个分区表 drop table if exists kimbo_test; create table kimbo_test ( order_id int, system_flag string ) PARTITIONED BY(dt string ) ROW FORMAT DELIMITED FIELDS TERMINATED BY \'\\001\' LINES TERMINATED BY \'\\n\' STORED AS TEXTFILE ; -- 插入数据 insert overwrite table kimbo_test partition(dt=\'20170601\') values (186000983,\'A\'),(286000983,\'B\') ; insert overwrite table kimbo_test partition(dt=\'20170602\') values (386000983,\'F\'),(486000983,\'W\') ; create table test_par like kimbo_test; -- 用 as select 复制一个新表 create table test_par2 as select * from kimbo_test where dt=\'20170601\' limit 0; -- 用 like 复制一个新表 create table test_par3 like kimbo_test; -- 注意差异: as select 复制的是一个非分区表, like 复制的是一个分区表。
表结构截图:
3. 将原表的数据复制到 新表(test_par3)
1. 创建新表: create table test_par3 like kimbo_test;
2. 将HDFS的数据文件复制一份到新表目录,hive cmd模式下: dfs -cp -f /user/hive/warehouse/kimbo_test/* /user/hive/warehouse/test_par3/
3. 修复分区元数据信息,hive cmd模式下: MSCK REPAIR TABLE test_par3;
结果查询:
以上是关于Hive 复制分区表和数据的主要内容,如果未能解决你的问题,请参考以下文章