对熊猫数据框的列应用差异[重复]

Posted

技术标签:

【中文标题】对熊猫数据框的列应用差异[重复]【英文标题】:Apply diffs down columns of pandas dataframe [duplicate] 【发布时间】:2019-10-24 00:16:39 【问题描述】:

我想对 pandas 数据框的列应用差异。 例如:

A      B      C
23   40000    1
24    nan    nan
nan  42000    2

我想要类似的东西:

A    B       C
23  40000    1
24  40000    1
24  42000    2

我尝试过 pandas groupby 的变体。我认为这可能是正确的方法。 (或在列下应用一些功能,但不确定这是否有效,如果我错了,请纠正我)

我能够“在列中应用差异”并得到类似的东西:

A     B     C
24  42000   2

通过调用: df = df.groupby('col', as_index=False).last() 为每一列,但这不是我要找的。我不是熊猫专家,如果这是一个愚蠢的问题,我深表歉意。

上面已经解释过了

【问题讨论】:

你想要df.ffill() ?? 正是我想要的,谢谢! 【参考方案1】:

看看这个:https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.fillna.html

df = df.fillna(method='ffill')

【讨论】:

以上是关于对熊猫数据框的列应用差异[重复]的主要内容,如果未能解决你的问题,请参考以下文章

熊猫移动平均线[重复]

如何同时对熊猫数据框中的列进行排序[重复]

在熊猫数据框中对重复的列 ID 进行分组

按名称切片数据框的列[重复]

删除熊猫中的标点符号[重复]

首先按最大负值对熊猫数据框的列进行排序