有没有办法在 java 中的 Spark 2.1 中进行广播加入

Posted

技术标签:

【中文标题】有没有办法在 java 中的 Spark 2.1 中进行广播加入【英文标题】:​Is there a way to do broadcast join in Spark 2.1 in java 【发布时间】:2018-12-15 17:50:31 【问题描述】:

我知道 scala 中存在如下所述的方法。

val joined_df = df1.join(broadcast(df2), "key")

如何在 Java 中进行广播加入。 我必须做 sc.broadcast (df2) 并在连接中使用它吗?那它会被称为广播加入吗?

【问题讨论】:

【参考方案1】:

如何在 Java 中进行广播加入。

完全一样。

import static org.apache.spark.sql.functions.broadcast;

Datset<Row> joined = df1.join(broadcast(df2), "key");

【讨论】:

以上是关于有没有办法在 java 中的 Spark 2.1 中进行广播加入的主要内容,如果未能解决你的问题,请参考以下文章

有没有办法将生成的 groupby 流加入到 kafka-spark 结构化流中的原始流?

有没有办法限制在 spark sql 中加入表时读取的数据?

如何从 Spark 中的 Slaves 内存中创建 RDD?

Spark + S3 + IAM 角色

1Spark 2.1 源码编译支持CDH

Spark中的虚拟内存是如何计算的?