Hive笔记之数据库操作

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Hive笔记之数据库操作相关的知识,希望对你有一定的参考价值。

 

创建数据库

hive创建数据库的最简单写法和mysql差不多:

create database foo;

仅当名为foo的数据库当前不存在时才创建:

create database if not exists foo;

创建数据库时指定位置,这个位置一般是在hdfs上的位置:

create database foo location \'/db/foo\';

 

查看已经创建的数据库:

show databases ;

使用通配符查看foo开头的数据库:

show databases like \'foo.*\';

 

查看创建数据库的语句:

show create database foo ;

image

hive为每一个数据库创建一个目录,这个数据库中的表将会以子目录的形式放在这个数据库目录下

有一个例外就是default数据库中的表,default数据库没有自己的目录,所以是直接放在/user/hive/warehouse下面的:

image 

同样的,当创建数据库如果没有指定存储位置,默认就是在/user/hive/warehouse/下的:

image

 

数据库描述信息

在创建数据库时可以指定描述性信息:

create database foo comment \'this is foo database\';

通过describe database可以查看到数据库的详细信息:

describe database foo;

image

 

数据库键值对信息

数据库可以有一些描述性的键值对信息,在创建时添加:

create database foo with dbproperties (\'own\'=\'cc\', \'day\'=\'20180120\');

查看数据库的键值对信息:

describe database extended foo;

image

要修改数据库的键值对信息:

alter database foo set dbproperties (\'k1\'=\'v1\', \'k2\'=\'v2\');

image

 

删除数据库

drop database if exists foo;

 

注意:

默认情况下是不允许直接删除一个有表的数据库的:

image

删除一个有表的数据库有两种办法:

1. 先把表删干净,再删库。

2. 删库时在后面加上cascade,表示级联删除此数据库下的所有表:

drop database if exists foo cascade;

 

prompt显示当前数据库名称

如果在一个数据库很多的环境下工作,需要 在不同的库之间切来切去(手动敲查询的时候全使用dbName.table可不是什么好主意…),可能一不小心就忘记自己当前在哪个数据库下了,可以通过设置一个属性改变当前的命令提示符,更专业的说法是prompt(用过CLI界面的应该对这个概念很熟悉),通过设置hive.cli.print.current.db属性可以在hive cli中显示当前数据库的名称,比如当前的数据库名称是foo:

set hive.cli.print.current.db=true

image

 

.

以上是关于Hive笔记之数据库操作的主要内容,如果未能解决你的问题,请参考以下文章

管理博文Hive大数据-Mysql的安装和启动---大数据之Hive工作笔记0007

Hive数仓项目之基本优化方案学生出勤主题看板分析

数据分析课程笔记 - 20 - HIVE 核心技能之窗口函数

hive学习笔记-表操作

Hive操作笔记

学习笔记:python3,代码片段(2017)