更新熊猫 groupby().last() 的列值

Posted

技术标签:

【中文标题】更新熊猫 groupby().last() 的列值【英文标题】:update column value of pandas groupby().last() 【发布时间】:2018-02-01 10:05:28 【问题描述】:

给定数据框:

dfd = pd.DataFrame('A': [1, 1, 2,2,3,3],
                    'B': [4, 5, 6,7,8,9],
                    'C':['a','b','c','c','d','e']
                   )

我可以通过使用找到每个A组的最后一个C值

dfd.groupby('A').last()['C']

但是,我想将 C 值更新为 np.nan。我不知道该怎么做。方法如:

def replace(df):
    df['C']=np.nan
    return replace

dfd.groupby('A').last().apply(lambda dfd: replace(dfd))

不起作用。

我想要这样的结果:

dfd_result= pd.DataFrame('A': [1, 1, 2,2,3,3],
                    'B': [4, 5, 6,7,8,9],
                    'C':['a',np.nan,'c',np.nan,'d',np.nan]
                   )

【问题讨论】:

【参考方案1】:

IIUIC,你需要loc。使用tail获取最后一个值的索引

In [1145]: dfd.loc[dfd.groupby('A')['C'].tail(1).index, 'C'] = np.nan

In [1146]: dfd
Out[1146]:
   A  B    C
0  1  4    a
1  1  5  NaN
2  2  6    c
3  2  7  NaN
4  3  8    d
5  3  9  NaN

dfd.loc[dfd.groupby('A').tail(1).index, 'C'] = np.nan 也应该没问题。

【讨论】:

请看我的更新示例,其中 C 列不包含数字。 谢谢。我认为您已经稍微更改了代码。稍后我会尝试并告诉你结果。

以上是关于更新熊猫 groupby().last() 的列值的主要内容,如果未能解决你的问题,请参考以下文章

如何从熊猫中的前一行复制缺失的列值[重复]

确定熊猫数据框中的列值何时更改

如何将熊猫系列的列值转换为Python中的列表?

如何在熊猫中显示类似空字符串的列值的计数

如何根据作为值列表的列值扩展熊猫数据框[重复]

将 pandas GroupBy 中的列值聚合为 dict