.NET 库,用于处理 HTML 电子邮件和剥离以前的响应

Posted

技术标签:

【中文标题】.NET 库,用于处理 HTML 电子邮件和剥离以前的响应【英文标题】:.NET library for processing HTML e-mails & stripping previous responses 【发布时间】:2010-09-10 08:57:57 【问题描述】:

有谁知道 .NET 库可以处理 html 电子邮件并可以用来修剪回复链?它需要能够接受 HTML 或文本邮件,然后删除除实际响应之外的所有内容,删除不是原始内容的邮件线索。我不希望它能够处理交错到上一封邮件中的响应(“在线响应”) - 这种情况可能会失败。

我们有一个基于 SgmlReader 和一系列 XSL 转换的自制程序,但它需要不断维护以处理新的电子邮件客户端。我想找一个我可以买的... :)

谢谢, 史蒂夫

【问题讨论】:

如果有人用不同的字体更改了之前的回复以使他们的更改显而易见,您打算怎么做?如果有人向我发送了 10 个问题,我会将我的答案添加到他们原始电子邮件中的问题下方。 【参考方案1】:

这并不能回答您的大部分问题,但 W3C 的 Converting HTML to Other Formats 有一个关于将 HTML 转换为文本的部分。我希望它可以帮助某人为您的问题制定完整的答案!

【讨论】:

【参考方案2】:

HtmlAgilityPack 是我们用来处理 HTML(包括格式错误的 HTML)的一个免费且非常有用的库。

没有 StripOutPreviousResponses() 函数,但它可以帮助您自制一个。

【讨论】:

谢谢,犹大。我们目前使用的 SgmlReader 代码可能是 HtmlAgilityPack 的祖先。我很想搬到受支持的图书馆。不幸的是,HTML 意图的识别是我们这里的主要问题,而不是对 HTML 本身的操作。但我很感激这个答案!

以上是关于.NET 库,用于处理 HTML 电子邮件和剥离以前的响应的主要内容,如果未能解决你的问题,请参考以下文章

在 Yahoo 和 Gmail 中显示时,HTML 电子邮件的内联 CSS 不断被剥离

三星电子推出X-net架构用于语音通话

.NET 从 HTML 页面中删除/剥离 JavaScript 和 CSS 代码块

.NET 图像处理程序在下载时剥离文件类型

用于快速流/批处理三角函数(Atan)的良好 .NET 库?

php 剥离MS Word HTML。来自php.net