Python异常值删除

Posted

技术标签:

【中文标题】Python异常值删除【英文标题】:Python Outlier Removing 【发布时间】:2021-11-16 14:54:57 【问题描述】:

我想去除绿点区域上的蓝点

我尝试使用蓝色组的残差法,以及蓝色组的 z-Score 方法,但无法将其删除。

x 和 y 之间存在相关性。

谁能分享一些想法或链接?

【问题讨论】:

如果您提供样本数据,我们只能提供帮助 但它看起来像它的集群。您可以删除 y 值最高的集群 【参考方案1】:

如果您同时使用 X 和 Y 创建一个新特征,然后设置阈值会怎样?

喜欢:

# Make new feature
df['xy'] = df['x'] * df['y']
# Filter
df = df[~(df['xy'] < threshold_val & df['gender'] == 'Male')]

【讨论】:

以上是关于Python异常值删除的主要内容,如果未能解决你的问题,请参考以下文章

python删除异常值,过滤并取平均值

Python异常值删除

python 从numpy数组中删除异常值

如何为管道中的异常值删除实现 Python 自定义类?

通过删除异常值来改进 R2-python

检测和删除异常值作为管道的步骤