一段时间后,打开的办公室在转换后的 PDF 中出现乱码字体崩溃

Posted

技术标签:

【中文标题】一段时间后,打开的办公室在转换后的 PDF 中出现乱码字体崩溃【英文标题】:open office crashes after some time giving garbled font in converted PDF 【发布时间】:2014-12-16 13:21:58 【问题描述】:

我们正在使用Java中的openoffice(3.4.1版本)和JODConverter将word转换为pdf。

下面是使用的代码。

OpenOfficeConnection 连接 = 新的 SocketOpenOfficeConnection(2100); 尝试 连接.connect();

  DocumentConverter converter = 
    new OpenOfficeDocumentConverter(connection);
  converter.convert(inputFile, outputFile);

  connection.disconnect();
  return "Sucess  " + DestinationPath + DestinationFileName;

catch (Exception localException1) 

问题是经过随机数天后,转换后的 PDF 包含乱码字体。 像 # # ! $ $ " % & 到目前为止,我们唯一的解决方案是重新启动服务器。系统人员说问题出在 Open Office 上。 我们使用 open office 来转换文档,因为它转换的 doc 文件完全包括所有格式和表格结构。 有什么办法可以解决这个问题。

【问题讨论】:

【参考方案1】:

因此,OpenOffice 在服务器上运行时可能会有些喜怒无常,尤其是因为它不是多线程的,并且您最终不得不运行 OpenOffice 进程池 - 请参阅 How can I use OpenOffice in server mode as a multithreaded service?。

此外,在转换为 PDF 时,渲染通常会关闭 - 请参阅 https://forum.openoffice.org/en/forum/viewtopic.php?f=7&t=68865,这就是为什么您可能要考虑使用转换服务来为您自动执行转换任务的原因?

为了完全透明,我为 Zamzar(在线文件转换服务)工作,我们最近发布了一个开发人员 API - https://developers.zamzar.com/,允许您在多种文件类型之间进行转换,特别适用于您在这里,因为我们支持doc 和 docx 都转换为 pdf,在 PDF 的呈现方式上几乎没有损失。或许值得看看这是否是尝试通过服务器上的 OpenOffice 运行您自己的解决方案的更好选择。

【讨论】:

以上是关于一段时间后,打开的办公室在转换后的 PDF 中出现乱码字体崩溃的主要内容,如果未能解决你的问题,请参考以下文章

怎样将Adobe Acrobat里的表格转换成excel里的表格?

txt文件如何转成pdf文件

转换后的 tiff 文件 (GhostScript) 中缺少 Pdf 文本框标记

qt集成dsoframer.ocx打开office办公软件

办公达人教你PPT如何转换成pdf

怎么分割pdf文件,办公达人教你一招