Python:使用 lxml 从 Open Office calc 导入数据

Posted

技术标签:

【中文标题】Python:使用 lxml 从 Open Office calc 导入数据【英文标题】:Python: Import Data from Open Office calc with lxml 【发布时间】:2010-03-01 14:31:36 【问题描述】:

如何导入例如字段 A1 的数据? 当我使用 etree.parse() 时出现错误,因为我没有 xml 文件。

【问题讨论】:

你有什么样的数据?如果不是 XML,那是什么? 【参考方案1】:

这是一个 zip 文件:

import zipfile
from lxml import etree

z = zipfile.ZipFile('mydocument.ods')

data = z.read('content.xml')
data = etree.XML(data)

etree.dump(data)

【讨论】:

我发布的内容适用于我在工作目录中保存为“mydocument.ods”的 OpenOffice 电子表格。 etree.dump 只是将漂亮的 xml 版本打印到标准输出,你是在标准输出的情况下运行它吗?我刚刚拿到它是为了向您展示那是已解析的文档,其中包含存储 A1 值的结构。 stdout - Standard Output 是程序将其输出写入的位置。 en.wikipedia.org/wiki/Standard_streams 你发布的错误消息不足以让我确定发生了什么,但很明显你没有运行我发布的示例。

以上是关于Python:使用 lxml 从 Open Office calc 导入数据的主要内容,如果未能解决你的问题,请参考以下文章

python的lxml解析器

使用 Python 和 lxml 从 HTML 中删除类属性

使用 python 和 lxml 模块从 html 中删除所有 javascript 标签和样式标签

使用由 Python 编写的 lxml 实现高性能 XML 解析

如何用 Python 和 lxml 抓取这个网页?返回空列表

lxml解析库的安装和使用