如何使用 Pentaho 数据集成提取电子邮件附件?

Posted

技术标签:

【中文标题】如何使用 Pentaho 数据集成提取电子邮件附件?【英文标题】:How to extract an email Attachment with Pentaho Data Integration? 【发布时间】:2016-03-18 13:42:40 【问题描述】:

让我从我想要完成的事情开始:

我每天收到 20 封来自客户的报告电子邮件,我必须提取每个附加的 .xls 文件,并根据文件的发送者进行一些简单的转换。

使用 Pentaho 数据集成,我设置了一些转换,但需要将之前提取的文件放在一个文件夹中。

现在我希望 PDI 读取电子邮件帐户(他们已经输入了电子邮件消息),但我可以看到它只读取电子邮件的数据,我还没有找到从某些电子邮件中提取附件并保存的方法他们到一个文件夹...

如果有人有不包括pentaho的解决方案,请回答我没有和pentaho结婚,只需要完成任务。

感谢您的帮助。

【问题讨论】:

How to get attached files from an email, using Pentaho Kettle?的可能重复 【参考方案1】:

Email messages input 无法将附件保存到文件夹。

但是,Get mails (POP3/IMAP) 作业步骤能够保存附件,因此您可以使用作业提取附件,然后启动转换来处理它们。

【讨论】:

我想这只是在“Utility”目录下的“Mail”。这听起来正确吗?也许这在最近的版本中有所改变。 我们知道为什么过滤选项不适用于获取邮件步骤吗?

以上是关于如何使用 Pentaho 数据集成提取电子邮件附件?的主要内容,如果未能解决你的问题,请参考以下文章

Pentaho 数据集成 - 从字符串中提取字符串

使用Python从邮件中下载附件和提取元数据

如何检查 cassandra 与 pentaho 数据集成器的连接

如何在 pentaho Kettle 中为生成的键表实现键查找

Pentaho 数据集成:错误处理

我如何在 pentaho 数据集成中设计星型模式