如何获取显示列异常值的行?
Posted
技术标签:
【中文标题】如何获取显示列异常值的行?【英文标题】:How can I get rows that present outliers for the column? 【发布时间】:2021-12-26 05:23:09 【问题描述】:首先我需要创建一个函数,当 z 分数低于 -3 或大于 3 时返回 True,否则返回 False。然后将该函数应用于数据框。但现在 我想显示列 stand_Gross.SqFt 的异常值的行。通过传递异常值系列的子集。我怎么做?我尝试的一切都是数字,这是一个字符串函数(真/假)。
def zscore (x):
if (x > 3):
return 'True'
elif (x < -3):
return 'True'
else :
return 'False'
将函数应用于数据框:
housing['stand_Gross.SqFt'].apply(zscore)
【问题讨论】:
【参考方案1】:你不想做“应用”,因为你会减慢你的代码速度
开始
housing['is_outlier'] = housing['stand_Gross.SqFt'] > 3
# print outliers
print(housing[housing['is_outlier']])
你可以直接跳过第一步
outliers = housing[housing['stand_Gross.SqFt'] > 3]
print(outliers)
【讨论】:
否,但我需要在代码中使用应用功能。最后的异常值系列是什么? 但现在我想显示列 stand_Gross.SqFt 的异常值的行。通过传递异常值系列进行子集化。以上是关于如何获取显示列异常值的行?的主要内容,如果未能解决你的问题,请参考以下文章