如何在 ADF 中从 SharePoint 下载更新的文件?

Posted

技术标签:

【中文标题】如何在 ADF 中从 SharePoint 下载更新的文件?【英文标题】:How to download updated files from SharePoint in ADF? 【发布时间】:2022-01-14 22:19:13 【问题描述】:

我在 SharePoint 位置有 100 多个文件,我每天都使用 ADF 和 Databricks 摄取和处理这些文件。并非所有文件每天都会更新,我最终会通过处理未更改的文件来浪费我的时间和资源。如何下载已更新的文件?

我的管道在周末不运行,但 SharePoint 文件在周末会有更新。

【问题讨论】:

【参考方案1】:

您可以将额外的 .md5 文件放在包含文件的 md5 摘要或其他适合您的管道处理的摘要信息的位置。然后您的管道可以选择跳过处理未更改的文件。

【讨论】:

以上是关于如何在 ADF 中从 SharePoint 下载更新的文件?的主要内容,如果未能解决你的问题,请参考以下文章

从 Sharepoint 列表到 Azure SQL 仓库的增量加载

如何下载跨多个网页的 SharePoint 列表

如何在外部 JavaScript 中从 ServerControl 访问 ClientID

Oracle ADF在查询组件中将secondaryPattern添加到Date

如何使用 CSOM 从/向 SharePoint 2013 下载/上传文件?

如何在 localhost:8000 中从 Laravel 的一个项目更改为另一个项目?