Hive 基本操作
Posted yuanmingzhou
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Hive 基本操作相关的知识,希望对你有一定的参考价值。
1.创建一个表
(字段表名不加引号‘,分隔符需要加引号)
create table t1( id int ,name string ,hobby array<string> ,add map<String,string> ) partitioned by( dt date ) row format delimited fields terminated by ‘,‘ collection items terminated by ‘-‘ map keys terminated by ‘:‘ ;
2.插入数据
LOAD DATA [LOCAL] INPATH ‘filepath‘ [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1,partcol2=val2 ...)]
·filepath 可以是:
相对路径,如project/data1
绝对路径,如/user/hive/project/data1
完整的URL,如hdfs://namenode:9000/user/hive/project/data1
目标可以是一个表或是一个分区。如果目标表是分区表,必须指定是要加载到哪个分区。
filepath 可以是一个文件,也可以是一个目录(会将目录下的所有文件都加载)。
·如果命令中带LOCAL,表示:
load命令从本地文件系统中加载数据,可以是相对路径,也可以是绝对路径。对于本地文件系统,也可以使用完整的URL,如file:///user/hive/project/data1
load命令会根据指定的本地文件系统中的filepath复制文件到目标文件系统,然后再移到对应的表
如果命令中没有LOCAL,表示从HDFS加载文件,filepath可以使用完整的URL方式,或者使用fs.default.name定义的值
·命令带OVERWRITE时加载数据之前会先清空目标表或分区中的内容,否则就是追加的方式。
3.删除表中数据
(1)按分区删除
ALTER TABLE test1 DROP PARTITION (dt=‘2016-04-29‘);
(2)清空表
insert overwrite table t_table1 select * from t_table1 where 1=0; TRUNCATE TABLE table_name
(3)连同表一起删除
DROP TABLE [IF EXISTS] table_name ;
以上是关于Hive 基本操作的主要内容,如果未能解决你的问题,请参考以下文章
VSCode自定义代码片段15——git命令操作一个完整流程