Python异常值删除
Posted
技术标签:
【中文标题】Python异常值删除【英文标题】:Python Outlier Removing 【发布时间】:2021-11-16 14:54:57 【问题描述】:我想去除绿点区域上的蓝点。
我尝试使用蓝色组的残差法,以及蓝色组的 z-Score 方法,但无法将其删除。
x 和 y 之间存在相关性。
谁能分享一些想法或链接?
【问题讨论】:
如果您提供样本数据,我们只能提供帮助 但它看起来像它的集群。您可以删除 y 值最高的集群 【参考方案1】:如果您同时使用 X 和 Y 创建一个新特征,然后设置阈值会怎样?
喜欢:
# Make new feature
df['xy'] = df['x'] * df['y']
# Filter
df = df[~(df['xy'] < threshold_val & df['gender'] == 'Male')]
【讨论】:
以上是关于Python异常值删除的主要内容,如果未能解决你的问题,请参考以下文章