删除行不是 .isin('X') [重复]
Posted
技术标签:
【中文标题】删除行不是 .isin(\'X\') [重复]【英文标题】:Remove rows not .isin('X') [duplicate]删除行不是 .isin('X') [重复] 【发布时间】:2012-12-12 23:32:24 【问题描述】:很抱歉刚刚进入 Pandas,这似乎是一个非常直截了当的问题。如何使用isin('X')
删除在列表X
中的行?在 R 中,我会写 !which(a %in% b)
。
【问题讨论】:
【参考方案1】:你有很多选择。整理上面的一些答案和accepted answer from this post 你可以这样做:
1.df[-df["column"].isin(["value"])]
2.df[~df["column"].isin(["value"])]
3.df[df["column"].isin(["value"]) == False]
4.df[np.logical_not(df["column"].isin(["value"]))]
注意:对于选项 4,您需要 import numpy as np
更新:您也可以为此使用.query
方法。这允许method chaining:
5.df.query("column not in @values")
.
其中values
是您不想包含的值的列表。
【讨论】:
~
和-
有什么区别?这是熊猫特有的吗?
@stragu 我不认为这是 Pandas 特有的。 ~
is a bitwise operation 在这种情况下导致与使用 -
相同的结果。但不幸的是,我对按位运算符的了解不够深入,无法深入回答您的问题【参考方案2】:
您可以使用numpy.logical_not
反转isin
返回的布尔数组:
In [63]: s = pd.Series(np.arange(10.0))
In [64]: x = range(4, 8)
In [65]: mask = np.logical_not(s.isin(x))
In [66]: s[mask]
Out[66]:
0 0
1 1
2 2
3 3
8 8
9 9
正如 Wes McKinney 在评论中给出的,您也可以使用
s[~s.isin(x)]
【讨论】:
【参考方案3】:你可以使用DataFrame.select
方法:
In [1]: df = pd.DataFrame([[1,2],[3,4]], index=['A','B'])
In [2]: df
Out[2]:
0 1
A 1 2
B 3 4
In [3]: L = ['A']
In [4]: df.select(lambda x: x in L)
Out[4]:
0 1
A 1 2
【讨论】:
谢谢 Hayden,对不起,我的问题有错别字,我想选择那些不在 A 中的,所以我可以知道 A,它会给我返回 B。跨度> 【参考方案4】:您所要做的就是创建一个数据框的子集,其中 isin 方法的计算结果为 False:
df = df[df['Column Name'].isin(['Value']) == False]
【讨论】:
以上是关于删除行不是 .isin('X') [重复]的主要内容,如果未能解决你的问题,请参考以下文章