删除行不是 .isin('X') [重复]

Posted 2023-03-10

技术标签:

【中文标题】删除行不是 .isin(\'X\') [重复]【英文标题】：Remove rows not .isin('X') [duplicate]删除行不是 .isin('X') [重复] 【发布时间】：2012-12-12 23:32:24 【问题描述】：

很抱歉刚刚进入 Pandas，这似乎是一个非常直截了当的问题。如何使用isin('X') 删除在列表X 中的行？在 R 中，我会写 !which(a %in% b)。

【问题讨论】：

【参考方案1】：

你有很多选择。整理上面的一些答案和accepted answer from this post 你可以这样做： 1.df[-df["column"].isin(["value"])] 2.df[~df["column"].isin(["value"])] 3.df[df["column"].isin(["value"]) == False] 4.df[np.logical_not(df["column"].isin(["value"]))]

注意：对于选项 4，您需要 import numpy as np

更新：您也可以为此使用.query 方法。这允许method chaining: 5.df.query("column not in @values"). 其中values 是您不想包含的值的列表。

【讨论】：

~ 和- 有什么区别？这是熊猫特有的吗？ @stragu 我不认为这是 Pandas 特有的。 ~ is a bitwise operation 在这种情况下导致与使用 - 相同的结果。但不幸的是，我对按位运算符的了解不够深入，无法深入回答您的问题【参考方案2】：

您可以使用numpy.logical_not 反转isin 返回的布尔数组：

In [63]: s = pd.Series(np.arange(10.0))

In [64]: x = range(4, 8)

In [65]: mask = np.logical_not(s.isin(x))

In [66]: s[mask]
Out[66]: 
0    0
1    1
2    2
3    3
8    8
9    9

正如 Wes McKinney 在评论中给出的，您也可以使用

s[~s.isin(x)]

【讨论】：

【参考方案3】：

你可以使用DataFrame.select方法：

In [1]: df = pd.DataFrame([[1,2],[3,4]], index=['A','B'])

In [2]: df
Out[2]: 
   0  1
A  1  2
B  3  4

In [3]: L = ['A']

In [4]: df.select(lambda x: x in L)
Out[4]: 
   0  1
A  1  2

【讨论】：

谢谢 Hayden，对不起，我的问题有错别字，我想选择那些不在 A 中的，所以我可以知道 A，它会给我返回 B。跨度> 【参考方案4】：

您所要做的就是创建一个数据框的子集，其中 isin 方法的计算结果为 False：

df = df[df['Column Name'].isin(['Value']) == False]

【讨论】：

以上是关于删除行不是 .isin('X') [重复]的主要内容，如果未能解决你的问题，请参考以下文章

在 Seaborn 中将相关矩阵绘制为热图时，是不是可以删除重复的列/行？

pandas去重

如何根据一列是不是具有特定值来查找重复行并删除输出？

删除记事本++中的重复行

同时删除两列中的重复行[重复]

从数据框中删除特定行[重复]