带有多索引和 parse_date 的 pandas read_excel；如何？

Posted 2023-03-12

技术标签:

【中文标题】带有多索引和 parse_date 的 pandas read_excel；如何？【英文标题】：pandas read_excel with multiindex and parse_date; how? 【发布时间】：2020-02-16 05:20:10 【问题描述】：

我正在尝试使用 pandas read_excel 来读取一个带有两个标题行和一个包含日期的列的 excel 文件。我正在尝试使用 parse_dates 功能来指定要解析的日期列，但是我遇到了一些麻烦，代码基本上是；

dateColNms= [('start_date', '(*)Start')]
df = pd.read_excel(fileName,  sheet_name = sheetNm, skiprows=0, header= [0,1], parse_dates = dateColNms)

代码抛出错误；

KeyError: '(*)Start'

我尝试了指定日期列名称的变体，但似乎都没有。有人有任何指示吗？谢谢，韦。

【问题讨论】：

你能创建一个minimum reproducible example吗？你的excel文件长什么样子？ 【参考方案1】：

您似乎没有名为“(*)Start”的列。尝试使用 parse_date='start_date' 读取 excel 文件以确认。

【讨论】：

【参考方案2】：

感谢您的回复。在发布我的问题之前，我确实尝试过使用它，它按预期工作。下面是特定标题列的快照。问候，Weh

header snapshot

【讨论】：

以上是关于带有多索引和 parse_date 的 pandas read_excel；如何？的主要内容，如果未能解决你的问题，请参考以下文章

Python Pandas 按多索引和列排序

pandas：选择索引，然后选择多索引切片上的列

Pandas，使用 merge_cells=False 从 excel 恢复多索引

Pandas 中的多索引、多年和每小时数据每天随机采样 N 小时

删除多索引和自动重命名列

合并具有多索引和列值的数据框