从蜂巢桶读取记录的问题

Posted

技术标签:

【中文标题】从蜂巢桶读取记录的问题【英文标题】:Issue in reading records from hive bucket 【发布时间】:2021-06-07 06:21:10 【问题描述】:

我创建了一个带有 4 个桶的蜂巢表.. 我可以从第 n 个桶中读取数据..

例如..

Select * from collection tablesample(bucket 1 out of 4 on loan_id)

但是如何从第二和第三桶中检索数据..

【问题讨论】:

【参考方案1】:

试试 UNION ALL:

Select * from collection tablesample(bucket 2 out of 4 on loan_id)
UNION ALL
Select * from collection tablesample(bucket 3 out of 4 on loan_id)

【讨论】:

@MuraliSelvaraj 如果可行,请接受/支持答案

以上是关于从蜂巢桶读取记录的问题的主要内容,如果未能解决你的问题,请参考以下文章

从具有时间戳的镶木地板蜂巢表中读取火花

蜂巢计数和计数不同不正确

蜂巢地图加入。 Hive 选择更大的表存储在缓存中

蜂巢中的分组/窗口化

使用 GCP Cloud DataFlow 读取 BigTable 并转换为通用记录

使用联合从 MS Access 表中选择随机记录 [重复]