合并行(差异)是逐行比较,而不是一行与其他表的整行

Posted

技术标签:

【中文标题】合并行(差异)是逐行比较,而不是一行与其他表的整行【英文标题】:Merge Rows (diff) is comparing row by row, not one row to entire rows of other table 【发布时间】:2018-07-20 05:42:02 【问题描述】:

我正在使用 Merge Rows (diff) 比较两张工作表。

第一个 Excel 表:

第二张excel表格:

还有我的 pentaho 交易:

在预览数据显示中,第 2 行的 id 2.0 是添加新行,在第 4 行显示相同的数据是删除,它假设相同,所以它是如何实现的。

【问题讨论】:

【参考方案1】:

合并行 (diff) 要求两个输入流都按合并键排序(编辑步骤属性时会出现警告)。

在合并行(差异)步骤之前在每个流中放置一个排序行步骤。

【讨论】:

赞成@nsouza 回答。并且不要害怕时间性能或内存问题。 PDI 非常聪明。

以上是关于合并行(差异)是逐行比较,而不是一行与其他表的整行的主要内容,如果未能解决你的问题,请参考以下文章

awk

awk编辑器

差异,同时忽略一行内的模式,但不是整行

shell脚本之awk编辑器

awk的基本用法

shell 之awk编辑器