Html 转 Doc(Word) 或 RTF 格式

Posted

技术标签:

【中文标题】Html 转 Doc(Word) 或 RTF 格式【英文标题】:Html To Doc(Word) Or RTF Format 【发布时间】:2009-06-22 09:31:34 【问题描述】:

html 页面(包含 css、表格、图像等)转换为 word 或 rtf 格式的最佳方法是什么。我已经知道添加

content-type = application/word 

header,这不是一个选项,因为我们需要将图像嵌入到文档中,这样就可以在没有有效互联网连接的情况下查看它。

我需要免费(最好)或商业 .NET 库或命令行实用程序,因为我需要在共享服务器上的托管 ASP.NET 应用程序上执行此操作:|。

【问题讨论】:

最好的方法是在发布之前进行搜索。这将节省我们的时间;-) 欺骗***.com/questions/471262/… 不是完全的欺骗;提交正在寻找 .NET 解决方案。 【参考方案1】:

如果您使用的是 Word 2003 或 2007,您可以使用 xslt 将 xhtml 文档转换为 Word Xml 文档。如果您在谷歌上搜索html to docx xsl,您会发现许多相反的示例(将 docx 转换为 html),因此您可以将其中一个示例作为转换的基础。唯一的挑战是下载图像并将其嵌入文档中,但that is also possible。

【讨论】:

【参考方案2】:

将 HTML 转换为 RTF 有多种可能性。这些链接应该可以帮助您入门:

DocFrac,HTML、RTF 和文本之间的转换。免费,在 Windows 上运行。 XHTML2RTF: An HTML to RTF conversion tool based on XSL Writing an RTF to HTML converter

转换为 MS Word .doc 更难,对您来说可能不值得。由于这很痛苦,请阅读Joel's interesting article on .doc。如果您出于某种原因必须编写 .doc,COM 与 MSOffice 的互操作可能是您最好的选择。

【讨论】:

我试过 DocFrac,它输出纯文本和一些垃圾。

以上是关于Html 转 Doc(Word) 或 RTF 格式的主要内容,如果未能解决你的问题,请参考以下文章

Linux命令word转TXT文件保持文本格局

将 RTF/DOC/DOCX 文件插入 Word 文件中的书签位置

目前有没有办法让 Emacs 缪斯模式输出 rtf、odt 或 doc 格式?

Python:通过pywin32模块批量将rtf或docx另存为doc格式

python模块将doc/pdf/docx/rtf格式转换为文本[重复]

word文件显示乱码怎么办?