Hive 基本操作

Posted yuanmingzhou

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Hive 基本操作相关的知识,希望对你有一定的参考价值。

1.创建一个表

(字段表名不加引号‘,分隔符需要加引号)

create table t1(
    id      int
   ,name    string
   ,hobby   array<string>
   ,add     map<String,string>
)
partitioned by(
dt date
)
row format delimited
fields terminated by ,
collection items terminated by -
map keys terminated by :
;

 

 

2.插入数据

LOAD DATA [LOCAL] INPATH filepath [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1,partcol2=val2 ...)]

·filepath 可以是:
    相对路径,如project/data1
    绝对路径,如/user/hive/project/data1
    完整的URL,如hdfs://namenode:9000/user/hive/project/data1
    目标可以是一个表或是一个分区。如果目标表是分区表,必须指定是要加载到哪个分区。
    filepath 可以是一个文件,也可以是一个目录(会将目录下的所有文件都加载)。
·如果命令中带LOCAL,表示:
    load命令从本地文件系统中加载数据,可以是相对路径,也可以是绝对路径。对于本地文件系统,也可以使用完整的URL,如file:///user/hive/project/data1
    load命令会根据指定的本地文件系统中的filepath复制文件到目标文件系统,然后再移到对应的表
    如果命令中没有LOCAL,表示从HDFS加载文件,filepath可以使用完整的URL方式,或者使用fs.default.name定义的值
·命令带OVERWRITE时加载数据之前会先清空目标表或分区中的内容,否则就是追加的方式。

3.删除表中数据

(1)按分区删除

ALTER TABLE test1  DROP PARTITION (dt=2016-04-29);

(2)清空表

insert overwrite table t_table1 select * from t_table1 where 1=0;

TRUNCATE TABLE table_name

(3)连同表一起删除

DROP TABLE [IF EXISTS] table_name  ;

 













以上是关于Hive 基本操作的主要内容,如果未能解决你的问题,请参考以下文章

VSCode自定义代码片段15——git命令操作一个完整流程

VSCode自定义代码片段15——git命令操作一个完整流程

Apache Hive 基本理论与安装指南

VSCode 如何操作用户自定义代码片段(快捷键)

c_cpp Robolution基本代码片段

Hive数据仓库--Java代码JDBC方式访问Hive中表的数据