在 Azure 数据工厂管道中处理 Null 值

Posted

技术标签:

【中文标题】在 Azure 数据工厂管道中处理 Null 值【英文标题】:Handle Null values in Azure Data factory Pipeline 【发布时间】:2021-09-27 03:03:40 【问题描述】:

我在 azure 和 Importing data from csv to sql table 中创建了一个管道。

当 csv 中存在空值/空值时,转换数据时出现异常。我试图在 Connection 的 Null 值文本框中进行验证,但它不起作用。谁能帮忙解决这个问题

【问题讨论】:

您是要避免这些行还是要使用其他值处理 null ? 是源端还是接收端的 Null 问题?我的猜测是数据库不希望您拥有的特定字段为 NULL 值...如果是这种情况,只需在数据库中将该字段设为 NULLABLE (如果这适合您的情况) 【参考方案1】:

在 Azure 数据工厂中处理 null 值创建派生列并使用 iifNull(ColumnName, 'Unknown') 表达式

下面给出详细步骤

第一步:如下图所示创建数据流

步骤 2: 在 Source1 中插入包含空值的 CSV 文件

第 3 步:现在创建派生列并使用 iifNull(ColumnName, 'Unknown') 表达式。

这里,我已将null 替换为‘Unknown’ 作为占位符

派生列输出

第四步:现在使用 SQL 数据库作为 sink 数据集

输出:

【讨论】:

以上是关于在 Azure 数据工厂管道中处理 Null 值的主要内容,如果未能解决你的问题,请参考以下文章

为啥管道在 Azure 数据工厂中永远停留在排队状态?

如何使用 Azure 数据工厂管道创建容器?

管道从 Azure 数据工厂消失了?

通过 GitLab 部署 Azure 数据工厂管道

如何在 Azure 数据工厂内拥有不同数量客户的不同环境中使用相同的管道?

如何在 Azure 数据工厂的 DataFlow 中获取管道的元数据?想要创建调试管道