Spark SQL 传递变量 - Synapse(Spark 池)
Posted
技术标签:
【中文标题】Spark SQL 传递变量 - Synapse(Spark 池)【英文标题】:Spark SQL passing variables - Synapse (Spark pool) 【发布时间】:2021-08-20 00:45:15 【问题描述】:我有以下 SparkSQL(Spark 池 - Spark 3.0)代码,我想将一个变量传递给它。我怎样才能做到这一点?我尝试了以下方法:
#cel 1 (Toggle parameter cell):
%%pyspark
stat = 'A'
#cel2:
select * from silver.employee_dim where Status= '$stat'
【问题讨论】:
【参考方案1】:当您将单元格作为 PySpark 运行时,您可以像这样将变量传递给您的查询:
#cel 1 (Toggle parameter cell):
%%pyspark
stat = 'A' #define variable
#cel2:
%%pyspark
query = "select * from silver.employee_dim where Status='" + stat + "'"
spark.sql(query) #execute SQL
由于您正在执行 SELECT 语句,我假设您可能希望将结果加载到 DataFrame:
sqlDf = spark.sql(query)
sqlDf.head(5) #select first 5 rows
【讨论】:
以上是关于Spark SQL 传递变量 - Synapse(Spark 池)的主要内容,如果未能解决你的问题,请参考以下文章
如何通过 Synapse 的 Spark 池将数据帧数据附加到专用的 SQL 池中?
从 Azure Synapse 中的 Apache Spark 将数据写入 SQL DW
从 Azure Synapse Analytics Spark Pool 连接到 Azure SQL 数据库