如何使用数据工厂将数据从 Azure Blob 存储增量加载到 Azure SQL 数据库?

Posted

技术标签:

【中文标题】如何使用数据工厂将数据从 Azure Blob 存储增量加载到 Azure SQL 数据库?【英文标题】:How to incrementally load data from Azure Blob storage to Azure SQL Database using Data Factory? 【发布时间】:2021-12-21 07:00:59 【问题描述】:

我有一个 json 文件存储在 Azure Blob 存储中,我已使用数据工厂将其加载到 Azure SQL DB 中。 现在我想找到一种方法,以便只将文件中的新记录加载到我的数据库中(因为文件每周左右更新一次)。有办法吗?

谢谢!

【问题讨论】:

如果我的回答有用,请接受它作为回答(点击回答左侧的复选标记)以帮助其他社区成员。 【参考方案1】:

您可以使用已在 Azure 数据工厂中实现的 upsert(渐变维度类型 1)。 它将添加新记录并更新已更改的旧记录。

这里有一个快速教程: https://www.youtube.com/watch?v=MzHWZ5_KMYo

【讨论】:

成功了!非常感谢!【参考方案2】:

我建议您使用 Dataflow 活动。

在数据流活动中,您可以选择更改行,如下图所示。

在 Alter 行中,您可以使用 Upsert if 条件。

这里提到条件为1 == 1

【讨论】:

此解决方案有效,非常感谢!

以上是关于如何使用数据工厂将数据从 Azure Blob 存储增量加载到 Azure SQL 数据库?的主要内容,如果未能解决你的问题,请参考以下文章

将数据从 Azure Blob 存储复制到 Azure SQLDB 时,Azure 数据工厂错误地复制单元格值

将 Azure 数据工厂上的数据管道从 SQL Server 复制到 Blob 存储

如何使用 azure 数据工厂下载 blob

将最新的文件夹从 azure blob 存储加载到 azure 数据工厂

无法将数据从 Snowflake 复制到 Azure Blob

如何使用数据工厂将 IoT 中心存储的 blob 复制到 Azure SQL