在无头模式下使用 Openoffice“导出”选项而不是“另存为”选项

Posted

技术标签:

【中文标题】在无头模式下使用 Openoffice“导出”选项而不是“另存为”选项【英文标题】:Use Openoffice "Export" option instead of "Save as" option in headless mode 【发布时间】:2013-11-22 08:50:19 【问题描述】:

您好,我正在使用 JOD 转换器将文档转换为 html

我已经通过两种方式测试了使用 openoffice(桌面模式)将 doc 文件转换为 html。

第一种方式:使用另存为选项

输出文件有很多 HTML4 不推荐使用的标签。

第二种方式:使用“导出”选项

输出文件是干净的,带有相应的 CSS。

仅供参考,我正在使用以下命令将 doc 转换为 html

soffice --headless -convert-to html:"HTML (StarWriter)" inputfile.doc

在 openoffice 无头模式下,当我尝试转换 doc 文件时,它使用“另存为”而不是“导出”,这会导致大量标签。 但是,我想在无头模式下使用命令使用“导出”而不是“另存为”。

【问题讨论】:

【参考方案1】:

我发现在 openoffice 无头版本和用户 Tidy 中无法将 html 转换为 html5 以将输出 html 转换为 html5。

用命令

tidy -c -m --indent true --doctype html5 inputfile.html

【讨论】:

以上是关于在无头模式下使用 Openoffice“导出”选项而不是“另存为”选项的主要内容,如果未能解决你的问题,请参考以下文章

使用 selenium 在无头模式下运行 Firefox 错误:“选项”对象没有属性“二进制”

在 Selenium 中使用无头选项时出现 TimeoutException

将 mySQL 表导出到 OpenOffice 电子表格

使用 Kameleo 的无头模式的附加镀铬选项

在 Windows 和 CentOS 上使用 PyUNO

在没有 GPU 的情况下以无头 chrome 渲染 WebGL 图像