从 Open Office 文档中获取内容

Posted

技术标签:

【中文标题】从 Open Office 文档中获取内容【英文标题】:Get content from Open Office document 【发布时间】:2016-05-26 06:44:14 【问题描述】:

如何从 Open Office 文档中获取文本?

我使用 OO 将 ms word 和 excel 文件转换为 PDF 格式,以便在网页中显示。但在某些情况下,可能会面临损坏的文件,并且损坏的文件以非常大的 xml 打开。

为了解决这个问题,我将获取第一行内容,如果存在 xml 标签,建议用户下载文档并尝试修复或在 ms word 中打开它。但是我没有找到任何详细的文档和如何处理文本的示例。

【问题讨论】:

您能否发布您用来与 OpenOffice 交互的代码示例? 【参考方案1】:

从标签中,我假设您正在使用 C# 查找信息。例子不多,看Andrew Pitonyak's Macro Document第24.1节。该示例将文本插入到编写器文档中。

读取文本的一种方法是创建一个光标,选择第一行,然后通过调用oCursor.getString() 获取值。 This page 显示了 Basic 中的示例命令,您可以适应 C#。

【讨论】:

以上是关于从 Open Office 文档中获取内容的主要内容,如果未能解决你的问题,请参考以下文章

word出现无法打开office open XML文件,因为内容有错误,该怎么办?

你好,我的word文档出现“无法打开office open xml”问题,求解决

word出现无法打开office open XML文件,因为内容有错误,点详细信息是文件已损坏,无法打开,这个怎么办

[Libre|Open]Office 中当前文档的路径

如何从 Word 文档中复制富文本内容控件的内容并使用 Open XML SDK 删除控件本身

使用 Java 获取 Open Office 中的工作表数