删除行不是 .isin('X') [重复]

Posted

技术标签:

【中文标题】删除行不是 .isin(\'X\') [重复]【英文标题】:Remove rows not .isin('X') [duplicate]删除行不是 .isin('X') [重复] 【发布时间】:2012-12-12 23:32:24 【问题描述】:

很抱歉刚刚进入 Pandas,这似乎是一个非常直截了当的问题。如何使用isin('X') 删除列表X 中的行?在 R 中,我会写 !which(a %in% b)

【问题讨论】:

【参考方案1】:

你有很多选择。整理上面的一些答案和accepted answer from this post 你可以这样做: 1.df[-df["column"].isin(["value"])] 2.df[~df["column"].isin(["value"])] 3.df[df["column"].isin(["value"]) == False] 4.df[np.logical_not(df["column"].isin(["value"]))]

注意:对于选项 4,您需要 import numpy as np

更新:您也可以为此使用.query 方法。这允许method chaining: 5.df.query("column not in @values"). 其中values 是您不想包含的值的列表。

【讨论】:

~- 有什么区别?这是熊猫特有的吗? @stragu 我不认为这是 Pandas 特有的。 ~ is a bitwise operation 在这种情况下导致与使用 - 相同的结果。但不幸的是,我对按位运算符的了解不够深入,无法深入回答您的问题【参考方案2】:

您可以使用numpy.logical_not 反转isin 返回的布尔数组:

In [63]: s = pd.Series(np.arange(10.0))

In [64]: x = range(4, 8)

In [65]: mask = np.logical_not(s.isin(x))

In [66]: s[mask]
Out[66]: 
0    0
1    1
2    2
3    3
8    8
9    9

正如 Wes McKinney 在评论中给出的,您也可以使用

s[~s.isin(x)]

【讨论】:

【参考方案3】:

你可以使用DataFrame.select方法:

In [1]: df = pd.DataFrame([[1,2],[3,4]], index=['A','B'])

In [2]: df
Out[2]: 
   0  1
A  1  2
B  3  4

In [3]: L = ['A']

In [4]: df.select(lambda x: x in L)
Out[4]: 
   0  1
A  1  2

【讨论】:

谢谢 Hayden,对不起,我的问题有错别字,我想选择那些不在 A 中的,所以我可以知道 A,它会给我返回 B。跨度> 【参考方案4】:

您所要做的就是创建一个数据框的子集,其中 isin 方法的计算结果为 False:

df = df[df['Column Name'].isin(['Value']) == False]

【讨论】:

以上是关于删除行不是 .isin('X') [重复]的主要内容,如果未能解决你的问题,请参考以下文章

在 Seaborn 中将相关矩阵绘制为热图时,是不是可以删除重复的列/行?

pandas去重

如何根据一列是不是具有特定值来查找重复行并删除输出?

删除记事本++中的重复行

同时删除两列中的重复行[重复]

从数据框中删除特定行[重复]