Pentaho 数据集成 - 从字符串中提取字符串

Posted

技术标签:

【中文标题】Pentaho 数据集成 - 从字符串中提取字符串【英文标题】:Pentaho Data Integration - Extract string from string 【发布时间】:2018-09-25 15:26:28 【问题描述】:

我有这个字符串:

货物:1托盘120x80x100 100KG

这是我将在 Ruby 中使用的正则表达式:

^Goods: <i>(.*)<br>$

这是我需要的结果:

1 托盘 120x80x100 100KG

如何在 Pentaho 数据集成中做到这一点?

【问题讨论】:

我觉得this thread可以给你一个提示。 也许你的字符串是Goods: &lt;i&gt;1 pallet 120x80x100 100KG&lt;/br&gt; 【参考方案1】:

有一个称为“拆分字段”的步骤,您将使用此数据输入列,并设置 : 作为分隔符,在“新字段”区域中,您将声明 2 个将接收拆分数据的新列。此步骤的工作方式非常类似于每个令牌的拆分字符串。

【讨论】:

【参考方案2】:

您也可以使用Regex Evaluation 步骤,但这一步依赖于Java 正则表达式,这与Ruby 的有点不同。但是,在您的情况下,它是相同的:

^Goods: <i>(.*)<br>$

【讨论】:

【参考方案3】:

您可以在[Modified] Java Script [Value] 步骤中使用相同的正则表达式:

^Goods: <i>(.*)<br>$

【讨论】:

以上是关于Pentaho 数据集成 - 从字符串中提取字符串的主要内容,如果未能解决你的问题,请参考以下文章

如何使用 Pentaho 数据集成提取电子邮件附件?

从结果集中获取行并在 Pentaho 数据集成中使用获取变量

从 Pentaho 数据集成连接到 MongoDB

Pentaho 数据集成 从数据库导入大型数据集

Pentaho 数据集成转换,从 csv 文件加载字段(Java API)

Pentaho 数据集成 (PDI):将布尔值从源插入到目标