Pandas - 以不等间隔绘制事件
Posted
技术标签:
【中文标题】Pandas - 以不等间隔绘制事件【英文标题】:Pandas - plot events with unequal interval 【发布时间】:2015-02-16 13:42:42 【问题描述】:我有一个代表事件日志的日期时间对象列表:
[datetime.datetime(2014, 12, 16, 0, 18, 12),
datetime.datetime(2014, 12, 16, 0, 18, 27),
datetime.datetime(2014, 12, 16, 0, 18, 27),
datetime.datetime(2014, 12, 16, 0, 19, 9),
datetime.datetime(2014, 12, 16, 0, 19, 39),
datetime.datetime(2014, 12, 16, 0, 19, 49),
datetime.datetime(2014, 12, 16, 0, 20, 2),
datetime.datetime(2014, 12, 16, 0, 20, 19),
datetime.datetime(2014, 12, 16, 0, 20, 47),
...
datetime.datetime(2014, 12, 16, 6, 23, 43),
datetime.datetime(2014, 12, 16, 6, 25, 45)]
如何创建每秒事件数的情节?例如。值应该是:
1 代表 datetime.datetime(2014, 12, 16, 0, 18, 12) 0 for datetime.datetime(2014, 12, 16, 0, 18, 13) - datetime.datetime(2014, 12, 16, 0, 18, 26) 2 for datetime.datetime(2014, 12, 16, 0, 18, 27) 等我尝试过这样的事情:
pd.Series([1 for _ in xrange(len(events_list))], index=events_list).plot()
还有这个:
df = pd.DataFrame('ts': t, 'value': 1 for t in events_list)
df.pivot_table(index='ts', columns='value', aggfunc=len, fill_value=0).plot()
显然我得到了错误的结果:
我可以要求指导我完成这个吗?
【问题讨论】:
【参考方案1】:您可能希望使用“value_counts”来计算特定时间事件的实例数,然后重新采样数据帧以填充 na,就像这样,
import pandas as pd
import datetime
events = [datetime.datetime(2014, 12, 16, 0, 18, 12),
datetime.datetime(2014, 12, 16, 0, 18, 27),
datetime.datetime(2014, 12, 16, 0, 18, 27),
datetime.datetime(2014, 12, 16, 0, 19, 9),
datetime.datetime(2014, 12, 16, 0, 19, 39),
datetime.datetime(2014, 12, 16, 0, 19, 49),
datetime.datetime(2014, 12, 16, 0, 20, 2),
datetime.datetime(2014, 12, 16, 0, 20, 19),
datetime.datetime(2014, 12, 16, 0, 20, 47),
datetime.datetime(2014, 12, 16, 6, 23, 43),
datetime.datetime(2014, 12, 16, 6, 25, 45)]
df = pd.DataFrame ('ts' : events)
df2 = df.ts.value_counts()
df2 = df2.resample('s').fillna(0)
print (df2.head(30))
这应该会产生,
2014-12-16 00:18:12 1
2014-12-16 00:18:13 0
2014-12-16 00:18:14 0
2014-12-16 00:18:15 0
2014-12-16 00:18:16 0
2014-12-16 00:18:17 0
2014-12-16 00:18:18 0
2014-12-16 00:18:19 0
2014-12-16 00:18:20 0
2014-12-16 00:18:21 0
2014-12-16 00:18:22 0
2014-12-16 00:18:23 0
2014-12-16 00:18:24 0
2014-12-16 00:18:25 0
2014-12-16 00:18:26 0
2014-12-16 00:18:27 2
2014-12-16 00:18:28 0
2014-12-16 00:18:29 0
2014-12-16 00:18:30 0
2014-12-16 00:18:31 0
2014-12-16 00:18:32 0
2014-12-16 00:18:33 0
2014-12-16 00:18:34 0
2014-12-16 00:18:35 0
2014-12-16 00:18:36 0
2014-12-16 00:18:37 0
2014-12-16 00:18:38 0
2014-12-16 00:18:39 0
2014-12-16 00:18:40 0
2014-12-16 00:18:41 0
Freq: S, dtype: float64
【讨论】:
以上是关于Pandas - 以不等间隔绘制事件的主要内容,如果未能解决你的问题,请参考以下文章
Python - 按时间间隔分组的时间加权平均 Pandas
pandas使用date_range函数通过设置起始时间(start)和结束时间(end)按照一定的频率(freq)间隔生成时间序列数据(以5小时为例)