如何将分号分隔的数据拆分为配置单元中的列并转置它?
Posted
技术标签:
【中文标题】如何将分号分隔的数据拆分为配置单元中的列并转置它?【英文标题】:How to split semicolon separated data to columns in hive and also transpose it? 【发布时间】:2015-06-29 11:28:06 【问题描述】:我在 hive 表中有一个以下格式的数据集。
<br><b>|Col_1 | Col_2 |Col_3</b></<br>
<br>|abc_1 | a;b;c;d |m;n</br>
<br>|abc_2 | e;f;d |l;h;p<br>
我需要将数据转换成以下格式。
<br><b>|Col_1 | Col_2_OR_3 |Value</b></<br>
<br>|abc_1 | Col_2 | a</br>
<br>|abc_1 | Col_2 | b</br>
<br>|abc_1 | Col_2 | c</br>
<br>|abc_1 | Col_2 | d</br>
<br>|abc_1 | Col_3 | m</br>
<br>|abc_1 | Col_3 | n</br>
<br>|abc_2 | Col_2 | e</br>
<br>|abc_2 | Col_2 | f</br>
<br>|abc_2 | Col_2 | d</br>
<br>|abc_2 | Col_3 | l</br>
<br>|abc_2 | Col_3 | h</br>
<br>|abc_2 | Col_3 | p</br>
数据最初在 Col_1 中的值是唯一的。Col_2 和 Col_3 中的分号分隔值需要分开并转置为新列 Value 并且需要创建另一列 Col_2_OR_3,其中包含从 Col_2Col_2 中选择分号分隔值的列的列标题值strong> 或 Col_3。
【问题讨论】:
【参考方案1】:select col_1,'Col_2',col_2_al
from <table_name>
lateral view explode(split(col_2, "\\\;")) col_2_al as col_2_al
union all
select col_1,'Col_3',col_2_al
from <table_name>
lateral view explode(split(col_3,"\\\;")) col_3_al as col_2_al
【讨论】:
以上是关于如何将分号分隔的数据拆分为配置单元中的列并转置它?的主要内容,如果未能解决你的问题,请参考以下文章