使用 jodconverter 和 OpenOffice 将 doc/docx 转换为 pdf
Posted
技术标签:
【中文标题】使用 jodconverter 和 OpenOffice 将 doc/docx 转换为 pdf【英文标题】:doc/docx to pdf using jodconverter and OpenOffice 【发布时间】:2013-06-16 14:17:02 【问题描述】:我正在使用 jodconverter
和 OpenOffice 3.3
使用以下命令将 docx 文件转换为 pdf:
java -jar jodconverter-cli-2.2.2.jar test.docx test.pdf
尝试转换大多数语言时它工作正常,但我无法转换用中文或日文编写的文档。这样做时,我得到的是乱码而不是文字:
我尝试安装日文和中文OpenOffice language packs 以及使用jodconverter 3.0 beta 4,但我得到了相同的输出。
Test file
如何添加对这些语言的支持?
我可以使用其他工具(最好是开源的)吗?
【问题讨论】:
【参考方案1】:我使用的 OO 版本中似乎有一个bug。我通过执行以下操作使其工作:
-
更新到最新的 OpenOffice。
下载丢失的 ttf 文件
按照this guide(或this)在Linux 中安装Windows True Type 字体
为确保字体安装正确,运行:
fc-list
要搜索特定语言,请使用:lang=
。例如,对于印地语:
fc-list :lang=hi
在添加MingLiU.ttf
字体和baekmuk-ttf-fonts rpm 包后,我得到了转换。
【讨论】:
以上是关于使用 jodconverter 和 OpenOffice 将 doc/docx 转换为 pdf的主要内容,如果未能解决你的问题,请参考以下文章
通过 JODConverter 和 LibreOffice 将 docx 转换为 pdf 会导致错误
jodconverter java.lang.ClassNotFoundException