如何旋转 Spark 数据框表? [复制]

Posted

技术标签:

【中文标题】如何旋转 Spark 数据框表? [复制]【英文标题】:how to pivot Spark dataframe table? [duplicate] 【发布时间】:2019-02-08 14:04:36 【问题描述】:

我有这个 3 列的表:

+---+----+----+
| id|type| val|
+---+----+----+
|  1|   A|   0|
|  2|   A|   0|
|  4|   A|   0|
|  2|   B|   1|
|  4|   B|   1|
+---+----+----+

我想把它改成类似:

+---+----+----+
|   |   A|   B|
+---+----+----+
|  1|   0|   -|
|  2|   1|   1|
|  4|   0|   1|
+---+----+----+

我试过了,但没有用:

val data_array = data.pivot(cols=['type'],rows=['id'],values='val')

【问题讨论】:

【参考方案1】:
df.groupBy("id").pivot("type").agg(first("value")).na.fill("-").show

df 是从测试数据文件创建的数据框

【讨论】:

以上是关于如何旋转 Spark 数据框表? [复制]的主要内容,如果未能解决你的问题,请参考以下文章