pandas dataframe按时间连续性分块

Posted zcsh

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了pandas dataframe按时间连续性分块相关的知识,希望对你有一定的参考价值。

当时序数据不连续时,需要将连续的数据划分为一块,基于pandas dataframe的方案如下。

>>> df
  DateAnalyzed       Val
1   2018-03-18  0.470253
2   2018-03-19  0.470253
3   2018-03-20  0.470253
4   2017-01-20  0.485949  # < watch out for this
5   2018-09-25  0.467729
6   2018-09-26  0.467729
7   2018-09-27  0.467729

>>> df.dtypes
DateAnalyzed    datetime64[ns]
Val                    float64
dtype: object



>>> dt = df[\'DateAnalyzed\']
>>> day = pd.Timedelta(\'1d\')
>>> in_block = ((dt - dt.shift(-1)).abs() == day) | (dt.diff() == day)
>>> in_block
1     True
2     True
3     True
4    False
5     True
6     True
7     True
Name: DateAnalyzed, dtype: bool

>>> filt = df.loc[in_block] >>> breaks = filt[\'DateAnalyzed\'].diff() != day >>> groups = breaks.cumsum() >>> groups 1 1 2 1 3 1 5 2 6 2 7 2 Name: DateAnalyzed, dtype: int64 >>> for _, frame in filt.groupby(groups): ... print(frame, end=\'\\n\\n\') ... DateAnalyzed Val 1 2018-03-18 0.470253 2 2018-03-19 0.470253 3 2018-03-20 0.470253 DateAnalyzed Val 5 2018-09-25 0.467729 6 2018-09-26 0.467729 7 2018-09-27 0.467729

  

以上是关于pandas dataframe按时间连续性分块的主要内容,如果未能解决你的问题,请参考以下文章

使用 Groupby 识别 Pandas Dataframe 中的连续相同值

python 在Pandas DataFrame中查找连续日期组

按日期对 Pandas DataFrame 进行分组

Pandas DataFrame 按时间戳分组

Pandas DataFrame 按分类列排序,但按特定类排序

按 10 分钟间隔对 pandas DataFrame 进行分组[重复]