在 Azure Synapse 的 Spark 代码中列出目录的内容
Posted
技术标签:
【中文标题】在 Azure Synapse 的 Spark 代码中列出目录的内容【英文标题】:List content of a directory in Spark code in Azure Synapse 【发布时间】:2021-08-16 04:47:49 【问题描述】:在 Databricks 的 Scala 语言中,命令 dbutils.fs.ls 列出目录的内容。但是,我正在使用 Azure Synapse 中的笔记本,它没有 dbutils 包。 dbutils.fs.ls对应的Spark命令是什么?
%%scala
dbutils.fs.ls("abfss://container@datalake.dfs.core.windows.net/outputs/wrangleddata")
%%spark
// list the content of a directory. ????
【问题讨论】:
【参考方案1】:只需使用mssparkutils
,它是一个粗略的等价物,主文档页面是here。一个简单的例子:
mssparkutils.fs.ls("/")
mssparkutils.fs.ls("abfss://container@datalake.dfs.core.windows.net/outputs/wrangleddata")
【讨论】:
以上是关于在 Azure Synapse 的 Spark 代码中列出目录的内容的主要内容,如果未能解决你的问题,请参考以下文章
从 Azure Synapse Analytics Spark Pool 连接到 Azure SQL 数据库
从 Azure Synapse 中的 Apache Spark 将数据写入 SQL DW
Azure Synapse:Spark 作业定义中指定的目标 Spark 池未处于成功状态。当前状态:供应
是否可以使用带有魔术命令的 Azure Synapse 在 Apache Spark 中运行 Bash 命令
我无法从数据块中的 spark 数据帧创建加载数据到 Azure Synapse (DWH)
如何使用 Azure Synapse Analytics 将自定义 Python 库导入到 Apache Spark 池中?