Hive--06---分区表分桶表

Posted 高高for 循环

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Hive--06---分区表分桶表相关的知识,希望对你有一定的参考价值。

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档

文章目录


分区表

1.概念

Hive中的分区就是 分目录(directory文件夹)


2.分区表基本操作

注意:分区字段不能是表中已经存在的数据,可以将分区字段看作伪列


3.分区表的增删查




4.二级分区





5.动态分区调整





静态分区

动态分区

hive3.0 以后也可以省略partition(deptno)

分桶表

1.概念


2.案例



Hive的分桶采用对分桶字段的值进行哈希

然后除以桶的个数求余方的方式,决定该条记录存放在哪个桶当中

3.抽样查询

1 outof 4

  • 4是 所有数据分成4份
  • 1是从第一份开始取

以上是关于Hive--06---分区表分桶表的主要内容,如果未能解决你的问题,请参考以下文章

分区表和分桶表

大数据之hive:hive分桶表

Hive中内部表外部表分区表分桶表之间的关系

分区表和分桶表

Hive:第 7 章 分区表和分桶表

Hadoop之Hive分桶表