从数据块 DBFS 中删除记录

Posted

技术标签:

【中文标题】从数据块 DBFS 中删除记录【英文标题】:Delete record from databricks DBFS 【发布时间】:2021-07-08 15:33:02 【问题描述】:

我正在尝试删除位于 DBFS 中的 Databricks Delta Lake 中的一些记录。我只有路径。没有保存为表格,有没有办法从增量文件中删除记录?

谢谢

【问题讨论】:

你能提供你想删除的例子吗? 从表中删除文件或记录? 我正在尝试从文件中删除记录,而不是从表中删除记录 【参考方案1】:

更新答案:

Delta Lake 能够使用DELETE FROM 命令执行删除,因此您只需要提供正确的WHERE 条件来匹配您要删除的记录(放置真实路径而不是<path-to-delta-table>):

DELETE FROM delta.`<path-to-delta-table>` WHERE your_condition

第一版答案,更新前:

DBFS is the file system,上面的项目是文件和目录。您可以使用 %fs rm file_name (docs) 或 Python 或 Scala 中相应的 dbutils.fs.rm("file_name") 命令删除文件和目录(请参阅 docs)。您甚至可以通过Databricks CLI、直接从您的计算机或通过 REST API 进行操作。

DBFS 中的另一个对象是挂载点,有special commands。如有必要,您可以卸载挂载点

【讨论】:

以上是关于从数据块 DBFS 中删除记录的主要内容,如果未能解决你的问题,请参考以下文章

从数据库中删除记录

删除主块oracle表单时如何删除所有细节块

Swift - 从数据库中删除单个记录

从核心数据中删除记录不起作用?

Bigquery如何从数据流中删除记录

Oracle删除表的几种方法及其比较