平均每五分钟数据作为熊猫数据框中的一个数据点

Posted

技术标签:

【中文标题】平均每五分钟数据作为熊猫数据框中的一个数据点【英文标题】:averaging every five minutes data as one datapoint in pandas dataframe 【发布时间】:2013-12-01 15:03:48 【问题描述】:

我在 Pandas 中有一个这样的数据框

1. 2013-10-09 09:00:05
2. 2013-10-09 09:01:00
3. 2013-10-09 09:02:00
4.  ............
5.   ............
6.   ............
7. 2013-10-10 09:15:05
8. 2013-10-10 09:16:00 
9. 2013-10-10 09:17:00

我想通过平均每 5 分钟的数据并为其形成 1 个数据点来减小数据框的大小..像这样

1. 2013-10-09 09:05:00
2. 2013-10-09 09:10:00
3. 2013-10-09 09:15:00

有人可以帮我吗?

【问题讨论】:

【参考方案1】:

你可能想看看pandas.resample:

df['Data'].resample('5Min', how='mean')

或者,how = 'mean' 是默认参数:

df['Data'].resample('5Min')

例如:

>>> rng = pd.date_range('1/1/2012', periods=10, freq='Min')
>>> df = pd.DataFrame('Data':np.random.randint(0, 500, len(rng)), index=rng)
>>> df
                     Data
2012-01-01 00:00:00   488
2012-01-01 00:01:00   172
2012-01-01 00:02:00   276
2012-01-01 00:03:00     5
2012-01-01 00:04:00   233
2012-01-01 00:05:00   266
2012-01-01 00:06:00   103
2012-01-01 00:07:00    40
2012-01-01 00:08:00   274
2012-01-01 00:09:00   494
>>>
>>> df['Data'].resample('5Min')
2012-01-01 00:00:00    234.8
2012-01-01 00:05:00    235.4

您可以找到更多示例here。

【讨论】:

以上是关于平均每五分钟数据作为熊猫数据框中的一个数据点的主要内容,如果未能解决你的问题,请参考以下文章

熊猫 - 计算每小时平均滚动 10 分钟

循环抓取的数据以将数据存储在 R 中的数据框中

每五分钟安排一次 Node.js 作业

计算熊猫中2个日期的分钟差[重复]

如何在熊猫日期时间数据框中索引打开和关闭?

具有时间偏移熊猫的滚动平均值