Hive Managed Table(内部表) 和 External Table(外部表)的区别

Posted houzhizhen

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Hive Managed Table(内部表) 和 External Table(外部表)的区别相关的知识,希望对你有一定的参考价值。

1. 数据管理的粒度不一样

1.1 内部表

drop 内部表的时候,数据会跟着删除。一些表必须为内部表,如事务表,insert_only 的事务表。

1.2 外部表

drop 外部表的时候,数据不会跟着删除,仅会删除表的定义。

2. 默认存储的路径不一样

2.1 内部表

内部表默认存储在参数 hive.metastore.warehouse.dir 指定的路径下。执行以下语句.

create database dwd;
use dwd;
create table t1(c1 string);

会在参数 hive.metastore.warehouse.dir 指定的路径下创建dwd.db/t1 用于存储表 t1 的数据。

当数据库位置不是默认位置时,会在数据库位置下创建目录,如:

create database dwd location '/tmp/dwd';
use dwd;
create table t1(c1 string);

则表 t1 的存储位置为 /tmp/dwd/t1

2.1 外部表

外部表默认存储在 参数 hive.metastore.warehouse.external.dir指定的路径下。如在 dwd 数据库下执行以下语句.

create table t1(c1 string);

会在参数 hive.metastore.warehouse.external.dir 指定的路径下创建dwd.db/t1 用于存储表 t1 的数据。

以上是关于Hive Managed Table(内部表) 和 External Table(外部表)的区别的主要内容,如果未能解决你的问题,请参考以下文章

hive深入使用

Hive笔记整理

Hive框架基础

Hive探秘--内部表外部表分区表桶表研究

hive简单建表

HIVE内部表和外部表互转ALTER语句