如何使用 Azure 数据工厂解析 Excel 的每一行

Posted

技术标签:

【中文标题】如何使用 Azure 数据工厂解析 Excel 的每一行【英文标题】:How to parse each row of an excel using Azure Data Factory 【发布时间】:2022-01-23 22:41:47 【问题描述】:

这是我的要求:

    我有一个 Excel 表格,其中几列和几行数据 我已将此 Excel 上传到 Azure blob 存储中 使用 ADF,我需要读取此 excel 并逐一解析其中的记录,并执行在 Azure blob 中创建动态文件夹的操作。 需要对 excel 中存在的每条记录执行此操作。 Excel 中的每条记录都有一些信息可以帮助我动态创建文件夹。

有人可以帮助我在 ADF 中选择正确的活动集或数据流来完成这项工作吗?

提前致谢!

【问题讨论】:

【参考方案1】:

这是我作为源的 Excel 文件。

我已经根据 Country 列在 Blob 存储中创建了文件夹。 我选择了 DataFlow 活动。

如下图所示,进入Sink configurationOptimize标签。

现在选择Partition option 作为Set Partition

Partition typeKey

Unique value per partition 作为Country 列。

现在运行管道。

预期输出:-

在这些文件夹中,您将获得包含相应数据的文件。

【讨论】:

非常感谢!有没有办法在 blob 中动态创建这些国家文件夹?例如。处理第 1 行时,会创建印度文件夹,依此类推。

以上是关于如何使用 Azure 数据工厂解析 Excel 的每一行的主要内容,如果未能解决你的问题,请参考以下文章

在 Azure 数据工厂中获取元数据没有成功给我多个 excel 文件

源数据集中的动态工作表名称:Azure 数据工厂上的(Excel(Blob 存储))。 - 错误:请为您的数据集选择一个工作表

如何使用 Azure 数据工厂使用私有终结点访问 Azure Function?

如何使用 azure 数据工厂拆分列值

如何使用 Azure 数据工厂管道创建容器?

如何强制 Azure 数据工厂数据流使用 Databricks