如何获取显示列异常值的行?

Posted

技术标签:

【中文标题】如何获取显示列异常值的行?【英文标题】:How can I get rows that present outliers for the column? 【发布时间】:2021-12-26 05:23:09 【问题描述】:

首先我需要创建一个函数,当 z 分数低于 -3 或大于 3 时返回 True,否则返回 False。然后将该函数应用于数据框。但现在 我想显示列 stand_Gross.SqFt 的异常值的行。通过传递异常值系列的子集。我怎么做?我尝试的一切都是数字,这是一个字符串函数(真/假)。

def zscore (x):
    if (x > 3):
        return 'True'
    elif (x < -3):
        return 'True'
    else :
        return 'False'

将函数应用于数据框:

housing['stand_Gross.SqFt'].apply(zscore)

【问题讨论】:

【参考方案1】:

你不想做“应用”,因为你会减慢你的代码速度

开始

housing['is_outlier'] = housing['stand_Gross.SqFt'] > 3
# print outliers
print(housing[housing['is_outlier']])

你可以直接跳过第一步

outliers = housing[housing['stand_Gross.SqFt'] > 3]
print(outliers)

【讨论】:

否,但我需要在代码中使用应用功能。最后的异常值系列是什么? 但现在我想显示列 stand_Gross.SqFt 的异常值的行。通过传递异常值系列进行子集化。

以上是关于如何获取显示列异常值的行?的主要内容,如果未能解决你的问题,请参考以下文章

如何获取列中多个最小值的索引?

如何在 QTableWidget 中仅获取包含值的行/列数?

如何获取表中具有空值的行,并且没有任何关于任何列名的行?

获取列具有特定值的行[重复]

排序,分组,并获取特定列值的行和行+1?

如何获取数据集中具有空值的列的总数? [复制]