获取大熊猫中的滞后数据

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了获取大熊猫中的滞后数据相关的知识,希望对你有一定的参考价值。

我想从数据集中获取滞后数据。数据集是每月一次,如下所示:

           Final Profits
JCCreateDate    
2016-04-30  31163371.59
2016-05-31  27512300.34
...
2019-02-28  16800693.82
2019-03-31  5384227.13

现在,从上面的数据集中,我选择了一个数据窗口(最近12个月的数据),我想从中减去3,6,9和12个月。

我已经创建了这样的窗口数据集:

df_all = pd.read_csv('dataset.csv')
df = pd.read_csv('window_dataset.csv')
data_start, data_end = pd.to_datetime(df.first_valid_index()), pd.to_datetime(df.last_valid_index())
dr = pd.date_range(data_start, data_end, freq='M')

现在对于日期范围dr我想减去几个月,让我们假设我从dr减去3个月并尝试从df_all检索数据

df_all.loc[dr - pd.DateOffset(months=3)]

这给了我以下输出

            Final Profits
2018-01-30  NaN
2018-02-28  9240766.46
2018-03-30  NaN
2018-04-30  13250515.05
2018-05-31  12539224.15
2018-06-30  17778326.04
2018-07-31  19345671.02
2018-08-30  NaN
2018-09-30  14815607.14
2018-10-31  28979099.74
2018-11-28  NaN
2018-12-31  12395273.24

我可以看到我有一些NaN,因为像Jan,Mar这样的月份已经有31天了,而减法搜索的是当月的错误日期。怎么处理呢?

答案

我不是100%你正在寻找但我怀疑使用转变。

# set up dataframe
index = pd.date_range(start='2016-04-30', end='2019-03-31', freq='M' )
df = pd.DataFrame(np.random.randint(5000000, 50000000, 36), index=index, columns=['Final Profits'])

# create three columns shifting and subtracing from 'Final_Profits'
df['3mos'] = df['Final Profits'] - df['Final Profits'].shift(3)
df['6mos'] = df['Final Profits'] - df['Final Profits'].shift(6)
df['9mos'] = df['Final Profits'] - df['Final Profits'].shift(9)

print(df.head(12))

         Final Profits        3mos        6mos        9mos
2016-04-30       45197972         NaN         NaN         NaN
2016-05-31        5029292         NaN         NaN         NaN
2016-06-30       20310120         NaN         NaN         NaN
2016-07-31       10514197 -34683775.0         NaN         NaN
2016-08-31       31219405  26190113.0         NaN         NaN
2016-09-30       21504727   1194607.0         NaN         NaN
2016-10-31       19234437   8720240.0 -25963535.0         NaN
2016-11-30       18881711 -12337694.0  13852419.0         NaN
2016-12-31       27237712   5732985.0   6927592.0         NaN
2017-01-31       21692788   2458351.0  11178591.0 -23505184.0
2017-02-28        7869701 -11012010.0 -23349704.0   2840409.0
2017-03-31       20943248  -6294464.0   -561479.0    633128.0

以上是关于获取大熊猫中的滞后数据的主要内容,如果未能解决你的问题,请参考以下文章

将熊猫数据框中的列向上移动一位?

无法获取数据,使用包 yfinance 按格式分组下载到熊猫数据框中,仅适用于我的子列表中的特定代码

从 URL 滞后片段加载 VideoView

Android中切换标签片段之间的延迟

Xcode中的变量模板(variable template)的用法

试图从熊猫数据框中获取小计