为签名部分中的图像解析电子邮件

Posted

技术标签:

【中文标题】为签名部分中的图像解析电子邮件【英文标题】:Parsing emails for images in signature section 【发布时间】:2012-11-20 12:39:30 【问题描述】:

有一个程序可以检查收件箱中的未读电子邮件,解析电子邮件内容并将其发送到记录。如果电子邮件中有任何图像,这些图像将作为记录的附件发送。现在,如果任何电子邮件的签名部分包含图像,该图像也会作为附件发送。

有没有一种方法可以检查电子邮件签名部分中的图像并忽略它们?或者有没有办法让我跳过整个签名内容的解析?

如果难以解析来自不同电子邮件服务器的电子邮件的签名部分,我想知道是否有可能来自 Outlook 的电子邮件?。

【问题讨论】:

您使用的是什么程序?你做了吗?您能否提供一个要删除的签名示例? 【参考方案1】:

在撰写邮件时将签名合并到邮件中。 消息发送后,通常无法将签名与发件人手动输入的内容区分开来。

但也许,如果您引用的签名始终具有某种通用格式,您可能可以使用正则表达式或类似的东西检测到该特定格式。

【讨论】:

根据 RFC,在 (newline) (dash) (dash) (space) (newline) 之后的所有内容都是 .signature。但我不认为 Microsoft Outlook 相信 RFC。如果您有多条来自同一作者的邮件,您可以在邮件末尾修剪任何相同的内容。不过,也许您可​​以简单地阻止您已经收到的图像(并在新的图像滑过时手动删除)。 很好,我不知道这两个破折号是标准的一部分。但我经常看到没有尾随空格的破折号,当然我看到的签名根本没有它们(例如我的)。

以上是关于为签名部分中的图像解析电子邮件的主要内容,如果未能解决你的问题,请参考以下文章

Tika 检测多部分/签名

NodeJS Mail listener2 正在将电子邮件签名图像作为附件下载到 Outlook 中,如何阻止它?

怎么样把PDF文件中的电子签名提取出来转换成PDF格式?

在电子邮件正文中显示附加图像

如何将图像转换为html?

发送包含嵌入图像的多部分 html 电子邮件