从 2 个数据帧中删除重复项 [重复]

Posted

技术标签:

【中文标题】从 2 个数据帧中删除重复项 [重复]【英文标题】:Drop duplicate from 2 dataframe [duplicate] 【发布时间】:2019-06-22 17:33:03 【问题描述】:

我有 2 个数据框,df1df2,带有一个 emails 列(以及其他不重要的列)。

我想删除df2 中包含df1 中已有电子邮件的行。

我该怎么做?

【问题讨论】:

这是有问题的。 df2[~df2.email.isin(df1.email)] @W-B 工作了,你摇滚 【参考方案1】:

你可以这样做:

df_1[~df_1['email_column'].isin(df_2['email_column'].tolist())

【讨论】:

以上是关于从 2 个数据帧中删除重复项 [重复]的主要内容,如果未能解决你的问题,请参考以下文章

在 pySpark 中删除重复项的最佳方法

从Dart列表中删除重复项的2种方法

SQL SERVER 2005删除重复数据

JavaScript 数组删除重复的单词或字符(如果只输入字符。不要从 1 个单词中删除所有重复项

从INSANE BIG WORDLIST中删除重复项

从 Netezza 表中删除重复项