带有多索引和 parse_date 的 pandas read_excel;如何?

Posted

技术标签:

【中文标题】带有多索引和 parse_date 的 pandas read_excel;如何?【英文标题】:pandas read_excel with multiindex and parse_date; how? 【发布时间】:2020-02-16 05:20:10 【问题描述】:

我正在尝试使用 pandas read_excel 来读取一个带有两个标题行和一个包含日期的列的 excel 文件。我正在尝试使用 parse_dates 功能来指定要解析的日期列,但是我遇到了一些麻烦,代码基本上是;

dateColNms= [('start_date', '(*)Start')]
df = pd.read_excel(fileName,  sheet_name = sheetNm, skiprows=0, header= [0,1], parse_dates = dateColNms)

代码抛出错误;

KeyError: '(*)Start'

我尝试了指定日期列名称的变体,但似乎都没有。有人有任何指示吗?谢谢,韦。

【问题讨论】:

你能创建一个minimum reproducible example吗?你的excel文件长什么样子? 【参考方案1】:

您似乎没有名为“(*)Start”的列。尝试使用 parse_date='start_date' 读取 excel 文件以确认。

【讨论】:

【参考方案2】:

感谢您的回复。在发布我的问题之前,我确实尝试过使用它,它按预期工作。下面是特定标题列的快照。 问候,Weh

header snapshot

【讨论】:

以上是关于带有多索引和 parse_date 的 pandas read_excel;如何?的主要内容,如果未能解决你的问题,请参考以下文章

Python Pandas 按多索引和列排序

pandas:选择索引,然后选择多索引切片上的列

Pandas,使用 merge_cells=False 从 excel 恢复多索引

Pandas 中的多索引、多年和每小时数据每天随机采样 N 小时

删除多索引和自动重命名列

合并具有多索引和列值的数据框