在pandas数据框中附加问题的时间序列
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了在pandas数据框中附加问题的时间序列相关的知识,希望对你有一定的参考价值。
我正在研究时间序列,我在pandas数据帧中发现了非常特殊的行为
当索引不是时间序列时,以下代码有效
import pandas as pd
df = pd.DataFrame({"a":[1,2,3], "b":[31,41,51],"c":[31,52,23]}, index=["z", "y", "x"])
df1 = pd.DataFrame({"a":[41,55,16]}, index=["w", "v", "u"])
df2 = pd.DataFrame({"b":[24,3,57]}, index=["w", "v", "u"])
df3 = pd.DataFrame({"c":[111,153,123]}, index=["w", "v", "u"])
df = df.append(df1)
dfx.ix[df2.index, "b"] = df2
df
的输出:
a b c
z 1 31 31
y 2 41 52
x 3 51 23
w 41 24 NaN
v 55 3 NaN
u 16 57 NaN
但是,当存在datetime64[ns]
索引或大小太大时,这不起作用
另外以下命令有效,当有datetime64[ns]
索引时
df = df.append(df1)
df["b"][df2.index] = df2
为什么会这样?
答案
你可以尝试fillna
:
df = df.append(df1)
print df.fillna(df2)
a b c
z 1 31 31
y 2 41 52
x 3 51 23
w 41 24 NaN
v 55 3 NaN
u 16 57 NaN
我用Datatimeindex
测试它并且效果很好:
import pandas as pd
df = pd.DataFrame({"a":[1,2,3], "b":[31,41,51],"c":[31,52,23]}, index=["z", "y", "x"])
df.index = pd.date_range('20160101',periods=3,freq='T')
df1 = pd.DataFrame({"a":[41,55,16]}, index=["w", "v", "u"])
df1.index = pd.date_range('20160104',periods=3,freq='T')
df2 = pd.DataFrame({"b":[24,3,57]}, index=["w", "v", "u"])
df2.index = pd.date_range('20160104',periods=3,freq='T')
df3 = pd.DataFrame({"c":[111,153,123]}, index=["w", "v", "u"])
df3.index = pd.date_range('20160104',periods=3,freq='T')
df = df.append(df1)
print df
a b c
2016-01-01 00:00:00 1 31 31
2016-01-01 00:01:00 2 41 52
2016-01-01 00:02:00 3 51 23
2016-01-04 00:00:00 41 NaN NaN
2016-01-04 00:01:00 55 NaN NaN
2016-01-04 00:02:00 16 NaN NaN
print df.fillna(df2)
a b c
2016-01-01 00:00:00 1 31 31
2016-01-01 00:01:00 2 41 52
2016-01-01 00:02:00 3 51 23
2016-01-04 00:00:00 41 24 NaN
2016-01-04 00:01:00 55 3 NaN
2016-01-04 00:02:00 16 57 NaN
df.ix[df2.index, "b"] = df2
print df
a b c
2016-01-01 00:00:00 1 31 31
2016-01-01 00:01:00 2 41 52
2016-01-01 00:02:00 3 51 23
2016-01-04 00:00:00 41 24 NaN
2016-01-04 00:01:00 55 3 NaN
2016-01-04 00:02:00 16 57 NaN
以上是关于在pandas数据框中附加问题的时间序列的主要内容,如果未能解决你的问题,请参考以下文章
Pandas - 在数据框中附加字符串:ValueError:无法从重复的轴重新索引
使用 pandas 连接两个数据框中的不同列(并附加相似的列)
Python pandas 使用附加字符串列汇总数据框中的往返数据 [关闭]