Hive的分桶

Posted lyr999736

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Hive的分桶相关的知识,希望对你有一定的参考价值。

含义:实质是将数据分成不同的文件。hive中的分桶和hadoop中的reduce个数相同。

  首先设置采用分桶:

    hive>set hive.enforce.bucketing=true;

    hive>create table buckets_users(id int,name string) clustered by (id) into 4 buckets;

    hive>insert overwrite table buckets_users select * from student;

      说明:按照ID分桶,分为4个桶,buckets_users 和 student表的字段要相同。

以上是关于Hive的分桶的主要内容,如果未能解决你的问题,请参考以下文章

Hive中的分桶

Hive往分桶表表中导入数据

Hive(大数据)- 分桶和索引之间的区别

Hadoop之Hive分桶表

Hive数据仓库分桶表分区未显示分区的数据

Hive 在工作中的调优总结