使用 jodconverter 和 OpenOffice 将 doc/docx 转换为 pdf

Posted

技术标签:

【中文标题】使用 jodconverter 和 OpenOffice 将 doc/docx 转换为 pdf【英文标题】:doc/docx to pdf using jodconverter and OpenOffice 【发布时间】:2013-06-16 14:17:02 【问题描述】:

我正在使用 jodconverterOpenOffice 3.3 使用以下命令将 docx 文件转换为 pdf:

java -jar jodconverter-cli-2.2.2.jar test.docx test.pdf

尝试转换大多数语言时它工作正常,但我无法转换用中文或日文编写的文档。这样做时,我得到的是乱码而不是文字:

我尝试安装日文和中文OpenOffice language packs 以及使用jodconverter 3.0 beta 4,但我得到了相同的输出。

Test file

如何添加对这些语言的支持?

我可以使用其他工具(最好是开源的)吗?

【问题讨论】:

【参考方案1】:

我使用的 OO 版本中似乎有一个bug。我通过执行以下操作使其工作:

    更新到最新的 OpenOffice。 下载丢失的 ttf 文件 按照this guide(或this)在Linux 中安装Windows True Type 字体

为确保字体安装正确,运行:

fc-list

要搜索特定语言,请使用:lang=。例如,对于印地语:

fc-list :lang=hi

在添加MingLiU.ttf 字体和baekmuk-ttf-fonts rpm 包后,我得到了转换。

【讨论】:

以上是关于使用 jodconverter 和 OpenOffice 将 doc/docx 转换为 pdf的主要内容,如果未能解决你的问题,请参考以下文章

比 JODCONVERTER 更快 [关闭]

JODConverter 页面方向

通过 JODConverter 和 LibreOffice 将 docx 转换为 pdf 会导致错误

jodconverter java.lang.ClassNotFoundException

JODConverter - PDF 到 HTML 转换为垃圾数据

jodconverter实现在线预览