如何加入 DataFrames 的地图?斯卡拉火花

Posted

技术标签:

【中文标题】如何加入 DataFrames 的地图?斯卡拉火花【英文标题】:How to join a map of DataFrames? Scala Spark 【发布时间】:2018-12-11 00:14:57 【问题描述】:

我有一张 DataFrames 地图:

val myMap = Map(
    "name1" -> df1,
    "name2" -> df2,
    "name3" -> df3
)

我想将这些 DataFrame 加入到常用列的列表中:

val commonColumns = Seq("id", "time")

那么对于任意长度的 df 映射,我可以写什么语句来获得以下效果?:

val desiredDf = df1.join(df2, commonColumns).join(df3, commonColumns)

【问题讨论】:

【参考方案1】:

这个怎么样:

val desiredDf = myMap.values.reduce((l, r) => 
  l.join(r, commonColumns)
)

【讨论】:

基本上,我对reduce非常陌生。这非常有效。谢谢!

以上是关于如何加入 DataFrames 的地图?斯卡拉火花的主要内容,如果未能解决你的问题,请参考以下文章

火花斯卡拉数据帧错误

sql 斯卡拉火花创建-databases.sql

sql 斯卡拉火花-SQL totalrevenuedaily.sql

如何将火花日志文件转换为一个 CSV 文件

如何使用SQL星火一个数据帧列中获取值?

斯卡拉:如何合并的地图集合