在 pura java 中将 docx/pptx 转换为 MHTML

Posted

技术标签:

【中文标题】在 pura java 中将 docx/pptx 转换为 MHTML【英文标题】:Convert docx/pptx to MHTML in pura java 【发布时间】:2011-04-01 09:29:16 【问题描述】:

我正在努力将 word 文档和 power point 演示文稿转换为 html/MHTML 页面。 我可以使用 docx4j 将文档转换为 html,但它会失真,并将图像等创建为单独的文件(标准 HTML)。

我有一个要求,用户上传 docx 和 pptx 文件,然后我可以在 Web 浏览器中向他们显示输出 HTML。所以我需要从文档中输出一个 *.mht 文件。 MS word aby 将文件保存为 mht 生成的输出类型很棒。我想要类似的功能,但仅限纯 Java。

我会在Linux上部署服务,所以甚至不能调用Ms Office的本地命令。

任何帮助将不胜感激。

谢谢

【问题讨论】:

你所说的“扭曲”离子是什么? 【参考方案1】:

以How to read or parse MHTML (.mht) files in java 为起点。

【讨论】:

以上是关于在 pura java 中将 docx/pptx 转换为 MHTML的主要内容,如果未能解决你的问题,请参考以下文章

.docx、.pptx 等的正确 MIME 类型是啥?

.docx、.pptx 等的正确 MIME 类型是啥?

将 Word/PowerPoint XML 转换为 docx/pptx

Java读写Excel之POI超入门(转)

docx4j 将office文件转为pdf

无法使用 OpenIn 功能通过应用程序中的 webbrowser 打开 docx 文件