根据表 B pyspark 从表 A 中选择条目 [重复]

Posted

技术标签:

【中文标题】根据表 B pyspark 从表 A 中选择条目 [重复]【英文标题】:Select entries from TABLE A based on TABLE B pyspark [duplicate] 【发布时间】:2020-10-11 17:32:19 【问题描述】:

在 SQL 中,我们可以根据表 B 中的列从表 A 中选择条目。

请看下面:

SELECT * FROM TABLE A 
WHERE NAME in (SELECT NAME FROM TABLE B)

如何在不使用 sql 上下文的情况下在 pyspark 中复制这段代码?

【问题讨论】:

这能回答你的问题吗? PySpark: match the values of a DataFrame column against another DataFrame column 【参考方案1】:

Df=A.join(B, on =['Name'], how ='inner' ).select(A.columns)

【讨论】:

这个问题是关于 Pyspark,而不是关于 Pandas 这是一个pyspark代码,请查看文档-dzone.com/articles/pyspark-join-explained-with-examples 是的,您现在已将答案更改为使用 Spark 语法

以上是关于根据表 B pyspark 从表 A 中选择条目 [重复]的主要内容,如果未能解决你的问题,请参考以下文章

如何从表 A 中选择表 B 中不存在的记录 [重复]

我有两个表我想从表 A 更新到表 B 。根据条件ID填空

从表A中选择部分字段插入到表B

是否可以根据表中的条目数将案例添加到 Select Case 中?

根据表中其他列的值从同一表中的 2 列中选择信息

在一对多关系表中,仅从表A中获得在表B中具有多个对应行的那些行