Hive Managed Table(内部表) 和 External Table(外部表)的区别
Posted houzhizhen
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Hive Managed Table(内部表) 和 External Table(外部表)的区别相关的知识,希望对你有一定的参考价值。
1. 数据管理的粒度不一样
1.1 内部表
drop 内部表的时候,数据会跟着删除。一些表必须为内部表,如事务表,insert_only 的事务表。
1.2 外部表
drop 外部表的时候,数据不会跟着删除,仅会删除表的定义。
2. 默认存储的路径不一样
2.1 内部表
内部表默认存储在参数 hive.metastore.warehouse.dir 指定的路径下。执行以下语句.
create database dwd;
use dwd;
create table t1(c1 string);
会在参数 hive.metastore.warehouse.dir 指定的路径下创建dwd.db/t1 用于存储表 t1 的数据。
当数据库位置不是默认位置时,会在数据库位置下创建目录,如:
create database dwd location '/tmp/dwd';
use dwd;
create table t1(c1 string);
则表 t1 的存储位置为 /tmp/dwd/t1
2.1 外部表
外部表默认存储在 参数 hive.metastore.warehouse.external.dir指定的路径下。如在 dwd 数据库下执行以下语句.
create table t1(c1 string);
会在参数 hive.metastore.warehouse.external.dir 指定的路径下创建dwd.db/t1 用于存储表 t1 的数据。
以上是关于Hive Managed Table(内部表) 和 External Table(外部表)的区别的主要内容,如果未能解决你的问题,请参考以下文章