使用 python 创建模型时处理 NAN 值
Posted
技术标签:
【中文标题】使用 python 创建模型时处理 NAN 值【英文标题】:Deal with NAN values when creating models with python 【发布时间】:2019-05-11 10:40:55 【问题描述】:我必须通过变量矩阵 (X) 来解释变量 (Y)。我的 Y 中有 NAN 值,这是要解释的变量。我的 NAN 值占了我观察的一半。 我应该删除 NAN 的 Y 行吗?
X:(整数矩阵)已清理且不包含 NAN 值。 Y:取(YES,NO,NAN)。 我该怎么办
谢谢你!!
【问题讨论】:
请编辑您的问题,任何人都无法阅读。 这不是技术问题。您必须问自己为什么 Y 变量中确实存在缺失值:数据收集问题? NaN 真的代表什么吗?不知道问题很难说。编辑:我怀疑这是一个机器学习问题。在 ML 中,数据清理、准备和探索是 80% 的任务。 NAN 什么也没说.. NAN = 我们不知道回应 那你有什么问题? 嗨,Mathilde,您最好在 Data Science Stack Exchange 上提问。 *** 更多的是关于编程。 【参考方案1】:要回答这个问题,我认为您需要回答更基本的问题“Y=NaN 是标签吗?”
如果您希望经过训练的模型预测三个标签之一(是、否、NaN),则用标签(例如“缺失”)填充 NaN。如果您不这样做(是或否),那么我看不出您如何在没有目标的情况下进行观察训练。放下这些,继续训练。
【讨论】:
NAN = 缺失值 .. 这不会帮助我建立模型。我必须专注于 Y= 是和 Y= 否。编辑:我想预测两个值之一(是,否) 我已经解决了这个问题,我告诉过你是否是这种情况下删除这些行...... 如果问题得到解决,您可以将其标记为已回答@Mathilde以上是关于使用 python 创建模型时处理 NAN 值的主要内容,如果未能解决你的问题,请参考以下文章