如何使用 Azure 数据工厂解析 Excel 的每一行
Posted
技术标签:
【中文标题】如何使用 Azure 数据工厂解析 Excel 的每一行【英文标题】:How to parse each row of an excel using Azure Data Factory 【发布时间】:2022-01-23 22:41:47 【问题描述】:这是我的要求:
-
我有一个 Excel 表格,其中几列和几行数据
我已将此 Excel 上传到 Azure blob 存储中
使用 ADF,我需要读取此 excel 并逐一解析其中的记录,并执行在 Azure blob 中创建动态文件夹的操作。
需要对 excel 中存在的每条记录执行此操作。
Excel 中的每条记录都有一些信息可以帮助我动态创建文件夹。
有人可以帮助我在 ADF 中选择正确的活动集或数据流来完成这项工作吗?
提前致谢!
【问题讨论】:
【参考方案1】:这是我作为源的 Excel 文件。
我已经根据 Country 列在 Blob 存储中创建了文件夹。 我选择了 DataFlow 活动。
如下图所示,进入Sink configuration的Optimize标签。
现在选择Partition option
作为Set Partition
。
Partition type
为Key
。
和Unique value per partition
作为Country
列。
现在运行管道。
预期输出:-
在这些文件夹中,您将获得包含相应数据的文件。
【讨论】:
非常感谢!有没有办法在 blob 中动态创建这些国家文件夹?例如。处理第 1 行时,会创建印度文件夹,依此类推。以上是关于如何使用 Azure 数据工厂解析 Excel 的每一行的主要内容,如果未能解决你的问题,请参考以下文章
在 Azure 数据工厂中获取元数据没有成功给我多个 excel 文件
源数据集中的动态工作表名称:Azure 数据工厂上的(Excel(Blob 存储))。 - 错误:请为您的数据集选择一个工作表