要检查 Pandas Dataframe 列的 TRUE/FALSE,如果 TRUE 检查另一列是不是满足条件并生成具有值 PASS/FAIL 的新列

Posted

技术标签:

【中文标题】要检查 Pandas Dataframe 列的 TRUE/FALSE,如果 TRUE 检查另一列是不是满足条件并生成具有值 PASS/FAIL 的新列【英文标题】:To check Pandas Dataframe column for TRUE/FALSE, if TRUE check another column for condition to satisfy and generate new column with values PASS/FAIL要检查 Pandas Dataframe 列的 TRUE/FALSE,如果 TRUE 检查另一列是否满足条件并生成具有值 PASS/FAIL 的新列 【发布时间】:2020-10-20 16:42:40 【问题描述】:

输入解释: 我有一个数据框“df”,其中包含“空格”和“阈值”列。

Space   Threshold

TRUE    0.1

TRUE    0.25

FALSE   0.5

FALSE   0.6

要考虑的场景: 当 df['Space'] 为 TRUE 时,检查 df['Threshold']

预期输出:

Space   Threshold   Space_Test

TRUE    0.1         PASS

TRUE    0.25        FAIL

FALSE   0.5         FALSE   

FALSE   0.6         FALSE   

试用过的代码: 已针对上述场景尝试了下面提到的代码行,但不起作用。

df['Space_Test'] = np.where(df['Space'] == 'TRUE',np.where(df['Threshold'] <= 0.2, 'Pass', 'Fail'),'FALSE')

需要帮助来解决这个问题。提前致谢!

【问题讨论】:

【参考方案1】:

另一种解决方案

from pandas import DataFrame

names = 
    'Space': ['TRUE','TRUE','FALSE','FALSE'],
    'Threshold': [0.1, 0.25, 1, 2]
         
df = DataFrame(names,columns=['Space','Threshold'])

df.loc[(df['Space'] == 'TRUE') & (df['Threshold'] <= 0.2), 'Space_Test'] = 'Pass'
df.loc[(df['Space'] != 'TRUE') | (df['Threshold'] > 0.2), 'Space_Test'] = 'Fail'

print (df)

【讨论】:

【参考方案2】:

如果TRUE 是布尔值,则您的解决方案仅通过df['Space'] 比较来简化:

df['Space_Test'] = np.where(df['Space'],
                   np.where(df['Threshold'] <= 0.2, 'Pass', 'Fail'),'FALSE')
print (df)
   Space  Threshold Space_Test
0   True       0.10       Pass
1   True       0.25       Fail
2  False       0.50      FALSE
3  False       0.60      FALSE

替代numpy.select:

m1 = df['Space']
m2 = df['Threshold'] <= 0.2
df['Space_Test'] = np.select([m1 & m2, m1 & ~m2], ['Pass', 'Fail'],'FALSE')
print (df)
   Space  Threshold Space_Test
0   True       0.10       Pass
1   True       0.25       Fail
2  False       0.50      FALSE
3  False       0.60      FALSE

【讨论】:

以上是关于要检查 Pandas Dataframe 列的 TRUE/FALSE,如果 TRUE 检查另一列是不是满足条件并生成具有值 PASS/FAIL 的新列的主要内容,如果未能解决你的问题,请参考以下文章

pandas改变dataframe的列的顺序改变数据列的排列次序

pandas改变dataframe索引数据列的数据类型(change the index column data type of pandas dataframe)

pandas筛选dataframe数据:获取dataframe的第N行第M列的内容(值)

如何检查pandas MultiIndex中是不是存在列

绘制带有条件列的 pandas DataFrame

pandas DataFrame行或列的删除方法