PENTAHO 数据集成中的流查找

Posted

技术标签:

【中文标题】PENTAHO 数据集成中的流查找【英文标题】:Stream lookup in PENTAHO Data Integration 【发布时间】:2013-08-23 12:03:37 【问题描述】:

在 Pentaho 数据集成中评估流查找步骤后是否可以获得多个结果行?我一直在使用 excel 输入文件尝试这个东西。但是结果集总是包含一行。实际上有更多的行要显示为结果。请帮忙

【问题讨论】:

您的意思是您的流查找步骤总共只产生一行,还是只为每个输入行产生一个输出行? 6 行作为输入添加,3 行必须输出。但在这种情况下,只有一行作为输出 您可以根据流经查找步骤的键从 Excel 文件中获取行。钥匙从哪里来?另一个 Excel 文件? 它来自之前的转换。使用获取行和选择值 那么我相信@Codek 的回答是最好的方法。您可以在Merge Join 之后使用另一个Select Values 来删除不需要的列,或者干脆不使用它们。 【参考方案1】:

您想要进行联接而不是查找单个值。因此,如果对于当前行,查找匹配您想要 2 行的 2 个值,对吗?因此,请改用合并连接步骤。您需要两个流中的传入行按键排序,如果您正在处理大量数据,这可能会很痛苦,但这就是这样做的方法。

【讨论】:

其实我不想加入行。我只想使用键列使用流查找控件扫描 excel 文件的内容,并希望返回与键列匹配的行。总共有 6 行 6 列。使用的键列是字符串格式。 您是否要为给定的键返回超过 1 行? 是的。我想获取不止一行(这是实际结果)

以上是关于PENTAHO 数据集成中的流查找的主要内容,如果未能解决你的问题,请参考以下文章

使用 pentaho 数据集成加载事实表

Pentaho 数据集成 (DI) 获取 SFTP 服务器目录中的最后一个文件

Pentaho 数据集成输入/输出位类型错误

Pentaho 数据集成用户定义的 Java 类

如何在 Pentaho 数据集成 (Kettle) 中的“用户定义的 Java 类”步骤中获取所有参数

pentaho 数据集成动态文件名