Pandas - 以不等间隔绘制事件

Posted

技术标签:

【中文标题】Pandas - 以不等间隔绘制事件【英文标题】:Pandas - plot events with unequal interval 【发布时间】:2015-02-16 13:42:42 【问题描述】:

我有一个代表事件日志的日期时间对象列表:

 [datetime.datetime(2014, 12, 16, 0, 18, 12),
  datetime.datetime(2014, 12, 16, 0, 18, 27),
  datetime.datetime(2014, 12, 16, 0, 18, 27),
  datetime.datetime(2014, 12, 16, 0, 19, 9),
  datetime.datetime(2014, 12, 16, 0, 19, 39),
  datetime.datetime(2014, 12, 16, 0, 19, 49),
  datetime.datetime(2014, 12, 16, 0, 20, 2),
  datetime.datetime(2014, 12, 16, 0, 20, 19),
  datetime.datetime(2014, 12, 16, 0, 20, 47),
  ...
  datetime.datetime(2014, 12, 16, 6, 23, 43),
  datetime.datetime(2014, 12, 16, 6, 25, 45)]

如何创建每秒事件数的情节?例如。值应该是:

1 代表 datetime.datetime(2014, 12, 16, 0, 18, 12) 0 for datetime.datetime(2014, 12, 16, 0, 18, 13) - datetime.datetime(2014, 12, 16, 0, 18, 26) 2 for datetime.datetime(2014, 12, 16, 0, 18, 27) 等

我尝试过这样的事情:

pd.Series([1 for _ in xrange(len(events_list))], index=events_list).plot()

还有这个:

df = pd.DataFrame('ts': t, 'value': 1 for t in events_list)
df.pivot_table(index='ts', columns='value', aggfunc=len, fill_value=0).plot()

显然我得到了错误的结果:

我可以要求指导我完成这个吗?

【问题讨论】:

【参考方案1】:

您可能希望使用“value_counts”来计算特定时间事件的实例数,然后重新采样数据帧以填充 na,就像这样,

import pandas as pd
import datetime
events = [datetime.datetime(2014, 12, 16, 0, 18, 12),
  datetime.datetime(2014, 12, 16, 0, 18, 27),
  datetime.datetime(2014, 12, 16, 0, 18, 27),
  datetime.datetime(2014, 12, 16, 0, 19, 9),
  datetime.datetime(2014, 12, 16, 0, 19, 39),
  datetime.datetime(2014, 12, 16, 0, 19, 49),
  datetime.datetime(2014, 12, 16, 0, 20, 2),
  datetime.datetime(2014, 12, 16, 0, 20, 19),
  datetime.datetime(2014, 12, 16, 0, 20, 47),
  datetime.datetime(2014, 12, 16, 6, 23, 43),
  datetime.datetime(2014, 12, 16, 6, 25, 45)]
df = pd.DataFrame ('ts' : events)
df2 = df.ts.value_counts()
df2 = df2.resample('s').fillna(0)
print (df2.head(30))

这应该会产生,

2014-12-16 00:18:12    1
2014-12-16 00:18:13    0
2014-12-16 00:18:14    0
2014-12-16 00:18:15    0
2014-12-16 00:18:16    0
2014-12-16 00:18:17    0
2014-12-16 00:18:18    0
2014-12-16 00:18:19    0
2014-12-16 00:18:20    0
2014-12-16 00:18:21    0
2014-12-16 00:18:22    0
2014-12-16 00:18:23    0
2014-12-16 00:18:24    0
2014-12-16 00:18:25    0
2014-12-16 00:18:26    0
2014-12-16 00:18:27    2
2014-12-16 00:18:28    0
2014-12-16 00:18:29    0
2014-12-16 00:18:30    0
2014-12-16 00:18:31    0
2014-12-16 00:18:32    0
2014-12-16 00:18:33    0
2014-12-16 00:18:34    0
2014-12-16 00:18:35    0
2014-12-16 00:18:36    0
2014-12-16 00:18:37    0
2014-12-16 00:18:38    0
2014-12-16 00:18:39    0
2014-12-16 00:18:40    0
2014-12-16 00:18:41    0
Freq: S, dtype: float64

【讨论】:

以上是关于Pandas - 以不等间隔绘制事件的主要内容,如果未能解决你的问题,请参考以下文章

在 Qt 中使用 QWT 生成间隔不等的图形

Pandas-如何添加条目跳过行的列?

将POSIX时间分配给R中的不等间隔

Python - 按时间间隔分组的时间加权平均 Pandas

pandas使用date_range函数通过设置起始时间(start)和结束时间(end)按照一定的频率(freq)间隔生成时间序列数据(以5小时为例)

以 5 分钟为间隔对 DataFrame 进行分组