加入带有日期范围的熊猫时间序列

Posted

技术标签:

【中文标题】加入带有日期范围的熊猫时间序列【英文标题】:Joining a pandas time series with a date range 【发布时间】:2017-10-18 17:14:57 【问题描述】:

我有一个按日期索引的熊猫系列和一个熊猫日期范围。系列中的日期是日期范围的子集。 Pandas 必须有一种超级优雅的方式来加入它们并用零填充缺失的值 - 但我现在想不出来。

pandas.date_range(start, end)

DatetimeIndex(['2017-04-20', '2017-04-21', '2017-04-22', '2017-04-23',
               '2017-04-24', '2017-04-25', '2017-04-26', '2017-04-27',
               '2017-04-28', '2017-04-29', '2017-04-30', '2017-05-01',
               '2017-05-02', '2017-05-03', '2017-05-04', '2017-05-05',
               '2017-05-06'],
              dtype='datetime64[ns]', freq='D')

data.groupby("Day").size()

Day
2017-04-20    462
2017-04-21     64
2017-04-22     13
2017-04-23      5
2017-04-24      9
2017-04-25      5
2017-04-26      1
2017-04-27      2
2017-04-30      1
2017-05-02      1
2017-05-04      1
2017-05-06      1
dtype: int64

想要的结果:

Day
2017-04-20    462
2017-04-21     64
2017-04-22     13
2017-04-23      5
2017-04-24      9
2017-04-25      5
2017-04-26      1
2017-04-27      2
2017-04-28      0
2017-04-29      0
2017-04-30      1
2017-05-02      1
2017-05-03      0
2017-05-04      1
2017-05-05      0
2017-05-06      1
dtype: int64

【问题讨论】:

【参考方案1】:
data.groupby("Day").size().reindex(pandas.date_range(start, end), fill_value=0)

演示

# I also named the new index :-)
data.groupby("Day").size().reindex(
    pd.date_range('2017-04-20', '2017-05-06', name='Day'), fill_value=0)

Day
2017-04-20    462
2017-04-21     64
2017-04-22     13
2017-04-23      5
2017-04-24      9
2017-04-25      5
2017-04-26      1
2017-04-27      2
2017-04-28      0
2017-04-29      0
2017-04-30      1
2017-05-01      0
2017-05-02      1
2017-05-03      0
2017-05-04      1
2017-05-05      0
2017-05-06      1
Freq: D, dtype: int64

【讨论】:

以上是关于加入带有日期范围的熊猫时间序列的主要内容,如果未能解决你的问题,请参考以下文章

在熊猫中传播范围日期

熊猫在日期时间之间离开加入

从日期时间范围创建熊猫数据框[重复]

熊猫创建没有周末的日期范围

使用熊猫按日期范围分组

熊猫将带有年份整数的列转换为日期时间