要检查 Pandas Dataframe 列的 TRUE/FALSE,如果 TRUE 检查另一列是不是满足条件并生成具有值 PASS/FAIL 的新列
Posted
技术标签:
【中文标题】要检查 Pandas Dataframe 列的 TRUE/FALSE,如果 TRUE 检查另一列是不是满足条件并生成具有值 PASS/FAIL 的新列【英文标题】:To check Pandas Dataframe column for TRUE/FALSE, if TRUE check another column for condition to satisfy and generate new column with values PASS/FAIL要检查 Pandas Dataframe 列的 TRUE/FALSE,如果 TRUE 检查另一列是否满足条件并生成具有值 PASS/FAIL 的新列 【发布时间】:2020-10-20 16:42:40 【问题描述】:输入解释: 我有一个数据框“df”,其中包含“空格”和“阈值”列。
Space Threshold
TRUE 0.1
TRUE 0.25
FALSE 0.5
FALSE 0.6
要考虑的场景: 当 df['Space'] 为 TRUE 时,检查 df['Threshold']
预期输出:
Space Threshold Space_Test
TRUE 0.1 PASS
TRUE 0.25 FAIL
FALSE 0.5 FALSE
FALSE 0.6 FALSE
试用过的代码: 已针对上述场景尝试了下面提到的代码行,但不起作用。
df['Space_Test'] = np.where(df['Space'] == 'TRUE',np.where(df['Threshold'] <= 0.2, 'Pass', 'Fail'),'FALSE')
需要帮助来解决这个问题。提前致谢!
【问题讨论】:
【参考方案1】:另一种解决方案
from pandas import DataFrame
names =
'Space': ['TRUE','TRUE','FALSE','FALSE'],
'Threshold': [0.1, 0.25, 1, 2]
df = DataFrame(names,columns=['Space','Threshold'])
df.loc[(df['Space'] == 'TRUE') & (df['Threshold'] <= 0.2), 'Space_Test'] = 'Pass'
df.loc[(df['Space'] != 'TRUE') | (df['Threshold'] > 0.2), 'Space_Test'] = 'Fail'
print (df)
【讨论】:
【参考方案2】:如果TRUE
是布尔值,则您的解决方案仅通过df['Space']
比较来简化:
df['Space_Test'] = np.where(df['Space'],
np.where(df['Threshold'] <= 0.2, 'Pass', 'Fail'),'FALSE')
print (df)
Space Threshold Space_Test
0 True 0.10 Pass
1 True 0.25 Fail
2 False 0.50 FALSE
3 False 0.60 FALSE
替代numpy.select
:
m1 = df['Space']
m2 = df['Threshold'] <= 0.2
df['Space_Test'] = np.select([m1 & m2, m1 & ~m2], ['Pass', 'Fail'],'FALSE')
print (df)
Space Threshold Space_Test
0 True 0.10 Pass
1 True 0.25 Fail
2 False 0.50 FALSE
3 False 0.60 FALSE
【讨论】:
以上是关于要检查 Pandas Dataframe 列的 TRUE/FALSE,如果 TRUE 检查另一列是不是满足条件并生成具有值 PASS/FAIL 的新列的主要内容,如果未能解决你的问题,请参考以下文章
pandas改变dataframe的列的顺序改变数据列的排列次序
pandas改变dataframe索引数据列的数据类型(change the index column data type of pandas dataframe)