如何在 Delphi 中将带有图像的 RichText (RTF) 文档转换为 HTML?
Posted
技术标签:
【中文标题】如何在 Delphi 中将带有图像的 RichText (RTF) 文档转换为 HTML?【英文标题】:How to convert RichText (RTF) document with images into HTML in Delphi? 【发布时间】:2011-06-07 17:57:44 【问题描述】:我一直在尝试寻找一个免费的(最好是开源的)组件或库,它允许将带有嵌入图像的 RTF 文件转换为 html 文件和图像文件或更好的 HTML 和图像流。
无论是 DLL 库还是 Delphi 组件,完美的解决方案都允许使用回调将数据流式传输到 IStream/TStream,因此我将能够将图像转换并保存为选择的格式,返回图像文件相对名称用于将 RTF 解析器包含在生成的 HTML 文件中,但按原样保存也很好,尤其是在代码开源时。
我遇到过商业解决方案,但我很难考虑它们,因为(相对)简单地将一种文档类型转换为另一种文档类型的价格相当高,而且两种格式都有 20 年的历史,这表明必须有现有的库(本地、未管理)进行此类转换。
如果我找不到解决方案,我可能会将this 代码转换为 Delphi dll 并使其可用,但也许有人已经这样做了?
编辑:
我们决定使用上述 .Net RtfConverter 编译为 DLL,从中生成 Delphi TLB 单元并强制客户安装 .Net 框架(嵌入在安装程序中)。现在转换就像一种魅力,另一个迹象表明是时候从 Delphi 转向 .Net...
【问题讨论】:
RTF 规范并不简单,转换也不像看起来那么简单。实际的 RTF 文档比带有一些粗体和斜体的简短 text-sn-ps 更复杂。考虑 Unicode 和本地化以及多种字体和 CSS 以及页眉和页脚以及段落格式以及表格和嵌套表格等。除了一些将 RTF 转换为 HTML 的商业软件工具之外,并非所有的商业软件工具都物有所值。我还没有写过,但我用过一个,售价 499 美元,现在有托管代码版本(100% C#)。 对于这种转换,简单的描述可能不是正确的,但 RTF 标记列表非常有限,Windows 和 Delphi 都有处理国际字符的工具。我也考虑使用转义 字符的 unicode 格式保存 HTML 文件。我在问题中提到的库是托管 C# 代码中的一个工作解决方案,我试图避免使用它来保持应用程序依赖关系尽可能低。 商业 RTF 到 HTML 转换器的起价约为 130 美元(不含版税)- 包括完整的 Delphi 源代码 mjn:您想发布对这个商业 Delphi 转换器的参考吗?如果没有免费的开源 Delphi/C++ 转换器,将codeproject.com/KB/recipes/RtfConverter.aspx 转换为 Delphi 会有问题,我肯定会考虑它作为最后的手段。 【参考方案1】:P.S:我是这个产品的开发者。
这是convert RTF to HTML 3.2, 4.01, XHTML 1.01 and HTML 5 的商业.Net 库。它
支持转换表格和嵌套表格、有序列表和项目符号列表、嵌入 HTML、Unicode、特殊 HTML 符号等的图像。
这是 C# 中的示例代码:
SautinSoft.RtfToHtml r = new SautinSoft.RtfToHtml();
r.OutputFormat = SautinSoft.RtfToHtml.eOutputFormat.HTML_5;
r.ImageStyle.IncludeImageInHtml = true;
r.ConvertFile(@"d:\document.rtf",@"d:\html5.htm");
【讨论】:
链接已损坏。作者自 2012 年以来就没有参加过 SO。这个答案应该被删除。【参考方案2】:RTF 到 HTML 4.01 / HTML5 和 RTF 到各种 XHTML 风格的商业转换器是 ScroogeXHTML for Delphi。 5.0 版包括改进的图片支持,以及 WMF 到 PNG 转换的示例代码。 (我是这个组件的开发者,也是 Java 平台对应的组件)。
【讨论】:
感谢您的链接。我将等待更长的时间来寻找可能的免费解决方案,因为它看起来很有希望。你有计划加入表格/列表支持吗? 支持简单的编号和未编号列表,但表格不太适合内部中间文档表示,需要重新设计(但正在考虑中)【参考方案3】:如果您可以使用 microsoft office 打开 RTF 然后在后台将其另存为 HTML,那么我相信这是您最好的解决方案,只需使用 OLE 在后台启动 Microsoft Word 实例,加载 RTF 然后导出它作为 HTML...
【讨论】:
不幸的是,这需要在机器上安装价值几百美元/英镑/...的商业产品。 对此我同意 110%,但是大多数用户倾向于安装 Office,因此如果您的目标是特定客户并且他拥有 Office 套件,那么我建议您使用这个,否则您将不得不搜索更多并自行实施...... @PA 取决于too的截止日期和其他东西,你可以称之为“两个问题”或(永久/临时)“胜利” 我可能假设客户已经安装了 Office 套件,以实现对 Office 的这种转换依赖,不管保证的兼容性和转换质量(如果您可以将 Word 生成的 HTML 视为兼容且质量好)可能被视为在这两种格式存在 2 年之后,应该存在不必要的复杂性和可能的替代本机代码转换器。它也可能是 RTF -> DOC -> HTML 路径,因为 DOC 更受欢迎。 @too 你可能也想看看 Open Office 套装,它可能有一些 *.DLL 可以进行转换以上是关于如何在 Delphi 中将带有图像的 RichText (RTF) 文档转换为 HTML?的主要内容,如果未能解决你的问题,请参考以下文章
如何在android中将EditText提示创建为带有图像的文本