打开 Office 用于 doc、docx 和 rtf 到 html 的转换

Posted

技术标签:

【中文标题】打开 Office 用于 doc、docx 和 rtf 到 html 的转换【英文标题】:Open Office for doc, docx and rtf to html conversion 【发布时间】:2012-06-30 11:57:34 【问题描述】:

如何从 doc、docs 和 rtf 文件中读取 html 格式的文本?

我的脚本在 LAMP 上,可以访问服务器上安装的 openoffice 进行这种类型的转换吗?

编辑

我不需要通过 php 扩展或 Apache 模块访问 openoffice,如果可以使用 cli trhoug php 也可以。

【问题讨论】:

【参考方案1】:

你可以试试普诺:http://www.wstech2.net/index.php?do=0a,01,05

这个项目是一个用 C++ 编写的 PHP5 模块,它将 OpenOffice.org UNO 编程 API 引入 PHP 用户空间。

它使用 OpenOffice 的 UNO 反射 API。这很容易开始。查看那里给出的示例。

【讨论】:

感谢@ksg91 的回复,一旦我确定我需要这个解决方案,我会通过它。需要研究其他可能性。 这是一个艰难而漫长的过程,但我参与其中。

以上是关于打开 Office 用于 doc、docx 和 rtf 到 html 的转换的主要内容,如果未能解决你的问题,请参考以下文章

docx文件转word文档

在没有 Microsoft.Office.Interop 的 .NET Core 中将 Word doc 和 docx 格式转换为 PDF

怎么把doc文件转换成docx

寻找用于从 ppt、pptx、doc、docx 文件中解析和提取对象的库 [关闭]

chorm谷歌浏览器为啥打不开.docx文件了(而是变成直接下载)?

Office Open XML文档怎么转换成word文档 2003的