Pandas - 合并 DataFrame 中的行 [重复]

Posted 2023-03-11

技术标签:

【中文标题】Pandas - 合并 DataFrame 中的行 [重复]【英文标题】：Pandas - Merge rows in a DataFrame [duplicate] 【发布时间】：2018-11-05 04:48:00 【问题描述】：

我正在尝试清理一些数据

数据框目前看起来像这样：

    id  data data2
0   12  NaN  50.0
1   12  a    50.0
2   12  a    NaN
3   52  b    NaN
4   52  NaN  20.0
5   52  NaN  20.0

我想折叠行以删除重复条目，并在这种特定情况下仅保留 ID 上的有效分组，忽略 NaN 及以上：

    id  data data2
0   12  a    50
1   52  b    20

【问题讨论】：

在这之前你有没有在两个dataFrames上调用pd.concat？不，这些数据是按原样提供给我的那么“忽略 NaN”是什么意思？这里的重复项是什么？你的问题有点笼统。那么，df.groupby('id').first()? @HarvIpan 不是 100% 肯定，但它可能是重复的。随意用我的评论编辑你的答案，这对我来说很好。 【参考方案1】：

你需要：

df.groupby('id', as_index=False).first()

输出：

    id  data    data2
0   12  a      50.0
1   52  b      20.0

【讨论】：

@coldspeed，谢谢。

以上是关于Pandas - 合并 DataFrame 中的行 [重复]的主要内容，如果未能解决你的问题，请参考以下文章