pandas 多索引切片“级别类型不匹配”
Posted
技术标签:
【中文标题】pandas 多索引切片“级别类型不匹配”【英文标题】:pandas multi index slicing "Level type mismatch" 【发布时间】:2016-02-21 11:01:26 【问题描述】:我从 0.13.1 迁移到 pandas 0.17 版,但在切片时遇到了一些新错误。
>>> df
date int data
0 2014-01-01 0 0
1 2014-01-02 1 -1
2 2014-01-03 2 -2
3 2014-01-04 3 -3
4 2014-01-05 4 -4
5 2014-01-06 5 -5
>>> df.set_index("date").ix[datetime.date(2013,12,30):datetime.date(2014,1,3)]
int data
date
2014-01-01 0 0
2014-01-02 1 -1
2014-01-03 2 -2
>>> df.set_index(["date","int"]).ix[datetime.date(2013,12,30):datetime.date(2014,1,3)]
Traceback (most recent call last):
...
TypeError: Level type mismatch: 2013-12-30
它在 0.13.1 上运行良好,而且它似乎特定于带日期的多索引。 我在这里做错了吗?
【问题讨论】:
【参考方案1】:出现此错误是因为您尝试对索引中未包含的日期(标签)进行切片。要解决此级别不匹配错误并在可能位于或不在 df 多索引内的范围内返回值,请使用:
df.loc[df.index.get_level_values(level = 'date') >= datetime.date(2013,12,30)]
# You can use a string also i.e. '2013-12-30'
get_level_values()
和比较运算符为索引器设置真/假索引值的掩码。
使用字符串或日期对象进行切片通常适用于具有单个索引的 Pandas,无论字符串是否在索引中,但不适用于多索引数据帧。尽管您尝试使用 datetime.date(2013,12,30) : datetime.date(2014,1,3) set_index 调用将索引从 2013-12-30 设置为 2014-01-03,但生成的 df 索引为从 2014 年 1 月 1 日到 2014 年 1 月 3 日。为包括 2013-12-30 在内的日期设置索引的一种正确方法是将索引设置为日期范围,使用日期时间对象的任一字符串,例如:
df.set_index("date").loc[pd.date_range('2013-12-30', '2014-12-03')]
【讨论】:
以上是关于pandas 多索引切片“级别类型不匹配”的主要内容,如果未能解决你的问题,请参考以下文章