如何将一个表中列的每个不同值映射到 Hive 中另一个表中列的每个不同值

Posted

技术标签:

【中文标题】如何将一个表中列的每个不同值映射到 Hive 中另一个表中列的每个不同值【英文标题】:How to map each distinct value of a column in one table with each distinct value of a column in another table in Hive 【发布时间】:2018-10-12 19:32:48 【问题描述】:

我在 Hive 中有两个表,Table1 和 Table2。我想获取 Table1 中的每个不同的 customerID,并将其映射到名为 Table2 的类别的列中的每个不同的值。但是,我对如何在蜂巢中执行此操作有点迷茫。我正在尝试做的一个更好的例子如下:假设 Table1 包含 5 个不同的 customerID,而 Table2 包含 3 个不同的类别。我希望我的查询结果如下所示:

但是 Table1 和 Table2 没有任何共同的列,所以我对如何在 hive 中的这两个表上执行连接有点迷茫。这个任务可以在蜂巢中完成吗?对此的任何见解将不胜感激!

【问题讨论】:

【参考方案1】:

您可以使用两个表中不同值的 cross join 来做到这一点。

select t1.customerid,t2.categories
from (select distinct customerid from tbl1) t1
cross join (select distinct categories from tbl2) t2

【讨论】:

以上是关于如何将一个表中列的每个不同值映射到 Hive 中另一个表中列的每个不同值的主要内容,如果未能解决你的问题,请参考以下文章

更新查询以根据不同表中的值更改一个表中列的现有值

更新查询以根据另一表中的值更改一个表中列的现有值

如何复制临时表中列的默认约束?

如何检查我的表中列的任何值是不是包含 MS ACCESS 2003 中的尾随空格?

如何根据pig中列的不同值拆分关系

表中列的唯一值组合