可以在 Databricks 集群运行后设置/修改的 Spark 会话属性

Posted

技术标签:

【中文标题】可以在 Databricks 集群运行后设置/修改的 Spark 会话属性【英文标题】:Spark session properties which can be be set/modified after Databricks cluster is running 【发布时间】:2021-12-23 08:42:53 【问题描述】:

我正在经历这个change the name of Spark application after it is started?。我怀疑在应用程序启动后我们可以通过 spark session 更改哪些所有属性。

例如下面提到的一些属性可以在应用程序启动后在笔记本中设置,同时我们需要写入Datalake。

spark.conf.set("dfs.adls.oauth2.access.token.provider.type", "ClientCredential")
spark.conf.set("dfs.adls.oauth2.client.id", clientId) 
spark.conf.set("dfs.adls.oauth2.credential",secretId)

【问题讨论】:

【参考方案1】:

当然,这些身份验证配置也可以在集群启动后设置使用 Spark 配置,可以为每个笔记本指定 Azure Data Lake Store 设置。但是,此方法强烈建议您不要以明文形式存储机密。您可以参考:link

【讨论】:

以上是关于可以在 Databricks 集群运行后设置/修改的 Spark 会话属性的主要内容,如果未能解决你的问题,请参考以下文章

databricks-connect 无法连接到 Databricks 集群运行时 8.4

升级集群的 Databricks Runtime 后调试 PySpark 时出错

init 脚本在 databricks 笔记本中运行良好,但在附加到集群时失败

: java.sql.SQLException: 尝试使用 Databricks Connect 在 Databricks 集群上运行 Python 脚本时没有合适的驱动程序

在 Spark 作业中获取 Databricks 集群 ID(或获取集群链接)

Databricks 在没有进展的情况下激发工作