使用php将pdf转换为word文档

Posted

技术标签:

【中文标题】使用php将pdf转换为word文档【英文标题】:Convert pdf to word document using php 【发布时间】:2017-03-22 03:17:27 【问题描述】:

我正在尝试在 php 中使用 Libreoffice 将 pdf 转换为 doc,但这不起作用。

path/to/soffice --infilter="writer_pdf_import" --convert-to doc file.pdf /path/to/test.docx

PS:有没有其他更好的解决方案来解析 pdf 并提取图像而不仅仅是文本,然后将其转换为 doc 表示形式。

【问题讨论】:

那个命令行不是 php 你能告诉我你的 PHP 代码吗? shell_exec("path/to/soffice --infilter="writer_pdf_import" --convert-to doc file.pdf /path/to/test.docx"); 我添加了我的答案。祝你好运 您找到解决方案了吗?如果你得到它,请分享。 【参考方案1】:

好吧,您没有向我们显示错误,所以我不知道您的命令为什么不起作用。但是,该命令不是Libreoffice 的命令。您正在使用soffice 的命令:

这是一个使用libreoffice软件的例子:

path/to/libreoffice --headless --invisible --convert-to doc your_source_file.pdf

注意:

此解决方案仅转换文本而不转换图像。

备选方案 01:

如果LibreOffice 在您的系统上不起作用,Abiword 也以类似的方式起作用。

    通过在终端输入以下命令来安装 Abiword
sudo apt-get install abiword

然后执行转换:

abiword --to=doc your_source_file.pdf

备选方案 02:

如果你想继续使用soffice的命令,或许你可以使用这个语法:

path/to/soffice --headless --convert-to <TargetFileExtension>:<NameOfFilter> your_source_file.pdf

在您的示例中,对doc 文件使用“MS Word 2007 XML”或对docx 使用“Microsoft Word 2007/2010/2013 XML”和“Microsoft Word 2007-2013 XML”作为过滤器:

path/to/soffice --headless --convert-to docx:"Microsoft Word 2007/2010/2013 XML" your_source_file.pdf

Here你可以找到更多过滤器。

【讨论】:

以上是关于使用php将pdf转换为word文档的主要内容,如果未能解决你的问题,请参考以下文章

如何将 Word 文档转换为 PDF? [关闭]

使用Python将Microsoft Word文档转换为PDF

如何将PDF文件转换为能编辑的Word文档

将Word文档转换为PDF文件的步骤和技巧

java中poi如何将word文档转换成pdf

将PDF文件转换为word文档格式