在 Azure Synapse 的 Spark 代码中列出目录的内容

Posted

技术标签:

【中文标题】在 Azure Synapse 的 Spark 代码中列出目录的内容【英文标题】:List content of a directory in Spark code in Azure Synapse 【发布时间】:2021-08-16 04:47:49 【问题描述】:

在 Databricks 的 Scala 语言中,命令 dbutils.fs.ls 列出目录的内容。但是,我正在使用 Azure Synapse 中的笔记本,它没有 dbutils 包。 dbutils.fs.ls对应的Spark命令是什么?

%%scala
  dbutils.fs.ls("abfss://container@datalake.dfs.core.windows.net/outputs/wrangleddata")
%%spark
  // list the content of a directory. ????

【问题讨论】:

【参考方案1】:

只需使用mssparkutils,它是一个粗略的等价物,主文档页面是here。一个简单的例子:

mssparkutils.fs.ls("/")
mssparkutils.fs.ls("abfss://container@datalake.dfs.core.windows.net/outputs/wrangleddata")

【讨论】:

以上是关于在 Azure Synapse 的 Spark 代码中列出目录的内容的主要内容,如果未能解决你的问题,请参考以下文章

从 Azure Synapse Analytics Spark Pool 连接到 Azure SQL 数据库

从 Azure Synapse 中的 Apache Spark 将数据写入 SQL DW

Azure Synapse:Spark 作业定义中指定的目标 Spark 池未处于成功状态。当前状态:供应

是否可以使用带有魔术命令的 Azure Synapse 在 Apache Spark 中运行 Bash 命令

我无法从数据块中的 spark 数据帧创建加载数据到 Azure Synapse (DWH)

如何使用 Azure Synapse Analytics 将自定义 Python 库导入到 Apache Spark 池中?