如何根据日期时间索引对 Pandas 数据框进行切片

Posted

技术标签:

【中文标题】如何根据日期时间索引对 Pandas 数据框进行切片【英文标题】:How to slice a Pandas Dataframe based on datetime index 【发布时间】:2018-09-26 20:41:48 【问题描述】:

这已经困扰我很久了:

给定一个简单的 pandas DataFrame

>>> df

Timestamp     Col1
2008-08-01    0.001373
2008-09-01    0.040192
2008-10-01    0.027794
2008-11-01    0.012590
2008-12-01    0.026394
2009-01-01    0.008564
2009-02-01    0.007714
2009-03-01   -0.019727
2009-04-01    0.008888
2009-05-01    0.039801
2009-06-01    0.010042
2009-07-01    0.020971
2009-08-01    0.011926
2009-09-01    0.024998
2009-10-01    0.005213
2009-11-01    0.016804
2009-12-01    0.020724
2010-01-01    0.006322
2010-02-01    0.008971
2010-03-01    0.003911
2010-04-01    0.013928
2010-05-01    0.004640
2010-06-01    0.000744
2010-07-01    0.004697
2010-08-01    0.002553
2010-09-01    0.002770
2010-10-01    0.002834
2010-11-01    0.002157
2010-12-01    0.001034

如何将它分开,以便新的 DataFrame 等于 df 中 2009-05-012010-03-01 之间日期的条目

>>> df2

Timestamp     Col1
2009-05-01    0.039801
2009-06-01    0.010042
2009-07-01    0.020971
2009-08-01    0.011926
2009-09-01    0.024998
2009-10-01    0.005213
2009-11-01    0.016804
2009-12-01    0.020724
2010-01-01    0.006322
2010-02-01    0.008971
2010-03-01    0.003911

【问题讨论】:

pandas.pydata.org/pandas-docs/stable/timeseries.html#indexing 【参考方案1】:

IIUC,一个简单的切片?

from datetime import datetime
df2 = df[(df.Timestamp >= datetime(2009, 05, 01)) &
         (df.Timestamp <= datetime(2010, 03, 01))]

【讨论】:

注意不用datetimedf[(df.Timestamp &gt;= '2009-05-01') &amp; (df.Timestamp &lt;= '2010-03-01')]就可以了【参考方案2】:

如果您已将“时间戳”列设置为索引,那么您可以简单地使用

df['2009-05-01' :'2010-03-01']

【讨论】:

另外,如果你只需要一个日期,你可以df.loc['2009-05-01'] :) 另外。如果您的索引中也有时间,您可以像这样使用它df.loc['2009-05-01 00:00:00':'2009-03-01 23:00:00'] 当且仅当您已排序索引且间隔列之间没有其他非相关列时,此方法才有效【参考方案3】:

你可以这样做:

df2 = df.set_index('Timestamp')['2009-05-01' :'2010-03-01']
print(df2)

【讨论】:

以上是关于如何根据日期时间索引对 Pandas 数据框进行切片的主要内容,如果未能解决你的问题,请参考以下文章

pandas:根据相同数据框的日期时间索引查找添加新列

如何从 Pandas 日期时间索引中删除尾随零(根据需要格式化)?

如何使用另一个日期时间索引获取具有日期时间索引的 Pandas 数据框中的行?

如何在 Pandas 数据框中按行值对日期时间列进行排序?

如何绘制日期时间索引数据框中特定列的手动箱线图?

Pandas:如何在数据透视表数据框中仅添加最新日期