从 Open Office 文档中获取内容
Posted
技术标签:
【中文标题】从 Open Office 文档中获取内容【英文标题】:Get content from Open Office document 【发布时间】:2016-05-26 06:44:14 【问题描述】:如何从 Open Office 文档中获取文本?
我使用 OO 将 ms word 和 excel 文件转换为 PDF 格式,以便在网页中显示。但在某些情况下,可能会面临损坏的文件,并且损坏的文件以非常大的 xml 打开。
为了解决这个问题,我将获取第一行内容,如果存在 xml 标签,建议用户下载文档并尝试修复或在 ms word 中打开它。但是我没有找到任何详细的文档和如何处理文本的示例。
【问题讨论】:
您能否发布您用来与 OpenOffice 交互的代码示例? 【参考方案1】:从标签中,我假设您正在使用 C# 查找信息。例子不多,看Andrew Pitonyak's Macro Document第24.1节。该示例将文本插入到编写器文档中。
读取文本的一种方法是创建一个光标,选择第一行,然后通过调用oCursor.getString()
获取值。 This page 显示了 Basic 中的示例命令,您可以适应 C#。
【讨论】:
以上是关于从 Open Office 文档中获取内容的主要内容,如果未能解决你的问题,请参考以下文章
word出现无法打开office open XML文件,因为内容有错误,该怎么办?
你好,我的word文档出现“无法打开office open xml”问题,求解决
word出现无法打开office open XML文件,因为内容有错误,点详细信息是文件已损坏,无法打开,这个怎么办