soffice 命令:从 html 到 odt 的转换不会产生所需的输出

Posted

技术标签:

【中文标题】soffice 命令:从 html 到 odt 的转换不会产生所需的输出【英文标题】:soffice command: conversion from html to odt produces no desidered output 【发布时间】:2016-02-02 10:10:13 【问题描述】:

我尝试转换从 Java 转换程序获得的 html 文件。

如果我从文件/打开菜单中打开它并从文件类型中选择 HTML,LibreOffice 会正确显示此文件。

在这种情况下,我在编辑器中显示从 LibreOffice 呈现的网页。所以,现在我想把这个文件转换成odt文件。

我试过这个命令,得到一个名为输入的odt文件:

soffice --headless --convert-to odt cleanedHtml.xml.html

创建的 .odt 文件,如果我用 LibreOffice Writer 直接打开它会显示原始 HTML,而我想显示渲染的 html 页面。如果我尝试使用 LibreOffice 作为 HTML 文件打开 cleanHtml.xml.html,如前所述,该文件会正确呈现,之后,我尝试另存为 odt 文件,LibreOffice 创建和 .odt 文件,其中包含呈现的内容我和作家一起打开它。

我需要一个命令,具有输入的 html 文件,给我从打开文件作为 HTML 文件获得的相同结果并将其保存为 odt。目标是获取带有渲染页面的 odt 文件,而不是使用 Writer 打开时的原始 html 代码。

感谢您的关注。

【问题讨论】:

您能否提供指向您的文件的链接?有关链接文件的示例,请参阅unix.stackexchange.com/questions/259361 【参考方案1】:

指定过滤器名称可能会有所帮助。查看 ask.libreoffice.org 对 this question 的第一个答案。试试writer8 过滤器:

--convert-to odt:"writer8"

将其与此的输出进行比较:

--convert-to odt:"writer_web_StarOffice_XML_Writer"

【讨论】:

两种方法我都尝试了,但无事可做。 当我测试一个页面时它产生了渲染的内容,所以显然问题只出现在某些文件上。

以上是关于soffice 命令:从 html 到 odt 的转换不会产生所需的输出的主要内容,如果未能解决你的问题,请参考以下文章

在Java中将odt转换为pdf而不启动soffice

在 Windows 上使用 Openoffice 将 ODT 转换为 PDF

无头鸭子在 MacOS 上不会嘎嘎叫

从 Java 启动 OpenOffice 服务 (soffice) 的问题(在命令行中工作的命令,但不是从 Java 中)

LibreOffice 命令行 (soffice) 打印选项

将 HTML 转换为 odt、doc、docx