将数据表从 Databricks dbfs 导出到 azure sql 数据库

Posted

技术标签:

【中文标题】将数据表从 Databricks dbfs 导出到 azure sql 数据库【英文标题】:Export data table from Databricks dbfs to azure sql database 【发布时间】:2021-11-23 05:04:11 【问题描述】:

我对 databricks 很陌生,正在寻找一种将数据表从 databricks 黄金方案导出到 azure sql 数据库的智能方法。 我将 databricks 用作 azure 资源组的一部分,但是我在同一资源组内的任何存储帐户中都找不到来自 databricks 的数据。这是否意味着它物理存储在隐式数据块存储帐户/数据湖中? 在此先感谢:-)

【问题讨论】:

【参考方案1】:

您在 Databricks 中看到的表可能将数据存储在该 Databricks 工作区文件系统 (DBFS) 或外部某个位置(例如 Data Lake,它可能位于不同的 Azure 资源组中) - 请参见此处:Databricks databases and tables

对于将数据从 Databricks 写入 Azure SQL,我建议使用 Apache Spark connector for SQL。

【讨论】:

以上是关于将数据表从 Databricks dbfs 导出到 azure sql 数据库的主要内容,如果未能解决你的问题,请参考以下文章

Databricks:将dbfs:/ FileStore文件下载到我的本地计算机?

在Databricks(DBFS)中递归列出目录和子目录的文件

如何从 QlikView 连接到 Databricks Delta 表?

如何使用 dbfs 之外的 Python 文件创建 Databricks 作业?

无法在 databricks 运行时版本 7 中使用 shell 命令访问 /dbfs/FileStore

带有 python 的 Azure Databricks dbfs