使用 python 创建模型时处理 NAN 值

Posted

技术标签:

【中文标题】使用 python 创建模型时处理 NAN 值【英文标题】:Deal with NAN values when creating models with python 【发布时间】:2019-05-11 10:40:55 【问题描述】:

我必须通过变量矩阵 (X) 来解释变量 (Y)。我的 Y 中有 NAN 值,这是要解释的变量。我的 NAN 值占了我观察的一半。 我应该删除 NAN 的 Y 行吗?

X:(整数矩阵)已清理且不包含 NAN 值。 Y:取(YES,NO,NAN)。 我该怎么办

谢谢你!!

【问题讨论】:

请编辑您的问题,任何人都无法阅读。 这不是技术问题。您必须问自己为什么 Y 变量中确实存在缺失值:数据收集问题? NaN 真的代表什么吗?不知道问题很难说。编辑:我怀疑这是一个机器学习问题。在 ML 中,数据清理、准备和探索是 80% 的任务。 NAN 什么也没说.. NAN = 我们不知道回应 那你有什么问题? 嗨,Mathilde,您最好在 Data Science Stack Exchange 上提问。 *** 更多的是关于编程。 【参考方案1】:

要回答这个问题,我认为您需要回答更基本的问题“Y=NaN 是标签吗?”

如果您希望经过训练的模型预测三个标签之一(是、否、NaN),则用标签(例如“缺失”)填充 NaN。如果您不这样做(是或否),那么我看不出您如何在没有目标的情况下进行观察训练。放下这些,继续训练。

【讨论】:

NAN = 缺失值 .. 这不会帮助我建立模型。我必须专注于 Y= 是和 Y= 否。编辑:我想预测两个值之一(是,否) 我已经解决了这个问题,我告诉过你是否是这种情况下删除这些行...... 如果问题得到解决,您可以将其标记为已回答@Mathilde

以上是关于使用 python 创建模型时处理 NAN 值的主要内容,如果未能解决你的问题,请参考以下文章

python中的nan值以及处理

Python3 DataFrame缺失值的处理

Python3 DataFrame缺失值的处理

模型在训练时,经过某个步骤后显示为 loss = nan

使用python绘制箱线图时如何处理NaN值

NSManagedObject 的描述显示值,但访问它们显示 NaN?