在 Azure 数据工厂复制活动中使用“附加列”时,如果源上已经存在该列,是不是会在接收端复制该列?

Posted

技术标签:

【中文标题】在 Azure 数据工厂复制活动中使用“附加列”时,如果源上已经存在该列,是不是会在接收端复制该列?【英文标题】:When using 'Additional columns' in Azure Data Factory's copy activity, will it duplicate the column on sink side if it exists on source already?在 Azure 数据工厂复制活动中使用“附加列”时,如果源上已经存在该列,是否会在接收端复制该列? 【发布时间】:2022-01-21 21:51:50 【问题描述】:

在复制 csv 文件时,我需要确保目标上存在某个列。此列可能存在也可能不存在于源文件中。如果我在复制活动中使用附加列部分,是否可以避免重复?

【问题讨论】:

【参考方案1】:

复制活动中的附加列是添加附加数据列以与源数据一起复制到接收器。

这不会验证该列是否存在于接收器中。

附加列可以存储源文件路径,将现有的源列复制为另一列、静态值、变量、管道参数。

请参阅此MS document 以获取有关复制活动中“附加”列的更多详细信息。

您可以使用获取元数据活动从源数据集和接收器数据集中获取列名并进行比较。使用 If 条件结果,您可以在 True 和 False 活动中复制具有附加列和不具有附加列的结构。

参考这个类似的SO 链接。

【讨论】:

以上是关于在 Azure 数据工厂复制活动中使用“附加列”时,如果源上已经存在该列,是不是会在接收端复制该列?的主要内容,如果未能解决你的问题,请参考以下文章

Azure 数据工厂复制活动失败。用户登录失败

如何在 Azure 数据工厂中为与外键相关的表创建管道并执行复制活动?

Azure 数据工厂链活动

在 Azure 数据工厂中使用 @item().name 设置“复制数据”源文件夹

Azure 数据工厂中的复制数据未完全读取文件

如何使用 Azure 数据工厂中的每个活动合并文件