Hive的分桶
Posted lyr999736
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Hive的分桶相关的知识,希望对你有一定的参考价值。
含义:实质是将数据分成不同的文件。hive中的分桶和hadoop中的reduce个数相同。
首先设置采用分桶:
hive>set hive.enforce.bucketing=true;
hive>create table buckets_users(id int,name string) clustered by (id) into 4 buckets;
hive>insert overwrite table buckets_users select * from student;
说明:按照ID分桶,分为4个桶,buckets_users 和 student表的字段要相同。
以上是关于Hive的分桶的主要内容,如果未能解决你的问题,请参考以下文章