更新熊猫 groupby().last() 的列值
Posted
技术标签:
【中文标题】更新熊猫 groupby().last() 的列值【英文标题】:update column value of pandas groupby().last() 【发布时间】:2018-02-01 10:05:28 【问题描述】:给定数据框:
dfd = pd.DataFrame('A': [1, 1, 2,2,3,3],
'B': [4, 5, 6,7,8,9],
'C':['a','b','c','c','d','e']
)
我可以通过使用找到每个A组的最后一个C值
dfd.groupby('A').last()['C']
但是,我想将 C 值更新为 np.nan。我不知道该怎么做。方法如:
def replace(df):
df['C']=np.nan
return replace
dfd.groupby('A').last().apply(lambda dfd: replace(dfd))
不起作用。
我想要这样的结果:
dfd_result= pd.DataFrame('A': [1, 1, 2,2,3,3],
'B': [4, 5, 6,7,8,9],
'C':['a',np.nan,'c',np.nan,'d',np.nan]
)
【问题讨论】:
【参考方案1】:IIUIC,你需要loc
。使用tail
获取最后一个值的索引
In [1145]: dfd.loc[dfd.groupby('A')['C'].tail(1).index, 'C'] = np.nan
In [1146]: dfd
Out[1146]:
A B C
0 1 4 a
1 1 5 NaN
2 2 6 c
3 2 7 NaN
4 3 8 d
5 3 9 NaN
dfd.loc[dfd.groupby('A').tail(1).index, 'C'] = np.nan
也应该没问题。
【讨论】:
请看我的更新示例,其中 C 列不包含数字。 谢谢。我认为您已经稍微更改了代码。稍后我会尝试并告诉你结果。以上是关于更新熊猫 groupby().last() 的列值的主要内容,如果未能解决你的问题,请参考以下文章